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مقدمة الكتاب: 

بدأت فكرة هذا الكتاب yo‏ تدريسي wI‏ العملي لطلاب الإحصاء الرياضي في كلية 
العلوم بجامعة حلب -طلاب السنة الرابعة /مقرر البرامج الإحصائية المتقدمة- مع الدكتور 
القدير حيان حسن. حيث اقترح علي زملائي وطلابي eag‏ محاضرات العملي التي كتبتها 
في كتاب pen‏ يكون مرجعاً مساعداً لطلاب الإحصاء بجامعة حلب. وحالما بدأت بجمع 
هذه المحاضرات وترتيبها. iy‏ فكرة توسيع الكتاب ليفطي جوانب أخرى هامة في 
الإحصاء حتى وصل إلى شكله الحالي الذي هو بين يديك. 

ينقسم هذا الكتاب إلى ثلاثة ilna pire‏ حيث تم عرض أساسيات اللفة وبنيتها في أول 
فصلين. وتم عرض القواعد البرمجية وأساليب التعامل مع البيانات في الفصلين الثالث 


والرابع. وتم تخصيص الفصل الخامس لتعلم الرسم باستخدام R‏ والفصل السادس انفرد 
بمواضيع متعلقة بنظرية الاحتمالات. lol‏ الفصول الستة التالية فكانت تستهدف ool‏ 


الأساليب والاختبارات الإحصائية. وفي الفصل الأخير تم التطرق لموضوع التنبؤ باستخدام 
السلاسل الزمنية. 


أتمنى أن أكون قد وفقت في تبسيط أسلوب هذا الكتاب, راجياً المولى je‏ وجل أن 
تتحقق الفائدة المرحوة منه. 


حلب 2017/9/22 


المؤلف 
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ari a ic meet etc tt rn ener Uae 3336 الفهرس‎ 
NA AEE EE ز‎ eee yT 8 الفصل الأول أساسيات لفة‎ 
A ee ee ae ااام‎ EE LION) bS 
FS A arte aerate (Mathematical and Logical Operators) العمليات الحسابية والمنطقية‎ 
111111710100000 ee R الملحوظات حول‎ Aag (Objects) الكائنات‎ 
1 EO O ee (Vectors) الأشعة‎ 
O rep و‎ seq التابعان‎ 
31... بعض التوابع الرياضية والاحصائية الهاصة‎ 
18 ovens doit! وبعض التطبيقات على‎ (Filtering) الفلترة‎ 
COO ا ا‎ S اللو م‎ 
Fp eee a ene ETO Tm er epee O E (Matrices) المصفوفات‎ 
DO ae eas ne AD as ee ba ar ee ‘apply التعليمة‎ 
Bo eet eee cece ae ene ae nano ree التعامل مع الأسطر والأعمدة:‎ 
232100000000 البيانات‎ Big الفصل الثاني القوائم‎ 
0 ببببببببب‎ 000 (Lists) القوائم‎ 
a EEEN enue saree nee ee ene الوصول لعناصر القائمة:‎ 
QG ee ee ao Frame) إطار البيانات‎ 
OU ees ae 8 Hu tain نب‎ ‘stack والتعليمة‎ View التعليمة‎ 
CO (Importing and Exporting Data) استيراد وتصدير البيانات‎ 
1-1000 1 الفصل الثالث العبارات الشرطية والعبارات التكرارية والتوابع ا‎ 
22 1-3 if العبارة الشرطية‎ 
SNS SE SS لف2015‎ 
E UEC MeO) UNO) | 
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000000200. yS 
304 ا‎ 
CAS CS el a Ia a ‘repeat حلقة‎ 
GS OSS (Functions) التوابع‎ 
21111313131 الفصل الرابع الأصناف 11000 ا‎ 
211010010 53 الصنف‎ 
A ه رمن 6 60 لاك اق‎ SLOAN SDI 
Ae ED O een Meta T, (Methods and Generic Functions) الطرائق والتوابع العامة‎ 
A ee E :54 الصنف‎ 
A SEE (Methods and Generic Functions) الطرائق والتوابع العامة‎ 
AGW ain yore mn ie (Reference Classes) الأصناف المرجعية‎ 
123 AE AE E LE E E: ملاحظة هامة:‎ 
ا‎ GR 
Ss Hane A E E aren sere antes ee ae ا‎ OMI 
E... OR ee NEAR, $3 الوراثة من الصنف‎ 
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SG ee ee E الأصناف المرجعية:‎ yo الوراثة‎ 
N EEES 1 010795 الفصل الخامس الرسم والمخططات‎ 
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IO ie ar op ac in Senn Arn an HAG a near ا‎ ULES 
6 sneer ل ود لوط‎ rarer مونو‎ Nam en avon ene Tame gone سس‎ 101915 1015230 al لامك كان‎ EBSD 
Za a orem ee eee toner rese EO cle retr BOSPORUS 
OG ره كار‎ acu 
120000039300 الفصل السادس نظرية الاحتمالات 8بببب00010‎ 
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A OT isin والتابع‎ 4in% التابع‎ 
7O ANEN ل‎ ‘Union, Intersection and Difference) الاجتماع والتقاطع والفرق‎ 
OE ER (Conditional Probabilities) الاحتمالات الشرطية‎ 
Te eee ere eee ا‎ BI DE Uo 
OE DR O RONI ‘(Poisson Distribution) poi2 توزيع بواسون‎ 
101121211131000 NON DIS لم‎ UE DD) ANI oS JI 
ee (Exponential Distribution) exp2 التوزيع الأسي‎ 
AE ATE O E (Normal Distribution) Nu, o2 التوزيع الطبيعي‎ 
oe (Chi-Square Distribution) y2 (n) توزيع كاي -مربع‎ 
GO A RR MT (Student Distribution). t(n) توزيع ستيودينت‎ 
8 OPSA S E A atest ا‎ (fisher Distribution) F (m,n) توزيع فيشر‎ 
E حساب التوقع الرياضي والتباين والانحراف المعياري لمتحول عشوائي‎ 
9200000 الفصل السابع اختبارات الطبيعية واختبارات تجانس التباينات‎ 
tok ا ا اا ا ا الا اا‎ EE ‘(Hypothesis Testing) اختبار الفرضيات‎ 
BOE ICED A Reece ASR (Some Normality Tests) بعض اختبارات الطبيعية‎ 
OO O O E eS ER O :Kolmogorov-Smirnov اختبار‎ 
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CTs eran ete eee eee eee ا‎ A ‘Tukey HSD اختبار‎ 
CO ae ا‎ E (Two Way ANOVA) تحليل التباين ثنائي الاتجاه‎ 
OO EEE N EE EO E E A ES ‘Tukey HSD عودة لاختبار‎ 
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E ext operas cessor ‘(Correlation Versus Causality) يعني السببية‎ J الارتباط‎ 
1l O 3 E AAA nN a Deepen a amar ‘(Partial Correlation) الارتباط الجزئي‎ 
OA (Simple Linear Regression) الانحدار الخطي البسيط‎ 
07s eee (Multiple Linear Regression) الانحدار الخطي المتعدد‎ 
QAO (Checking Regression Assumptions) التحقق من شروط الانحدار‎ 
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تجانس التباين للرواسب ET E OS (Homogeneity of Variance)‏ 
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استقلال الرواسب T6 eee ee ene (Independence of Residuals)‏ 
المصاحبة خطية المتعددة Wie ee (Multicollinearity)‏ 
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الفصل الحادي عشر الانحدار اللوجستي 1018| 
الانحدار اللوجستي الثنائي eon a (Binary Logistic Regression)‏ ا AIEEE‏ 
معايير 249 نموذج الانحدار اللوجستي الثنائي: eo‏ ا ا O‏ 
معيار معلومات أكاكي IE O E :(Akaike Information Criteria (AIC))‏ 
الانحراف الابتدائي وانحراف الرواسب .......................:(Null Deviance and Residual Deviance)‏ 120 
CROCS] aa‏ ا ا TPO eenean (CON‏ 
e TG Smatio terra Unni‏ 
الانحدار اللوجستي المتعدد WR Rey ety orp Rast carat Geer (Multinomial Logistic Regression)‏ 
OS‏ قة N‏ اللو مس [cde ey A‏ 
الفصل الثاني عشر الإحصاء اللامعلمي NAZ SS SS SS‏ 
اختبار ويلكوكسون للعينة الواحدة a E, (One Sample Wilcoxon Test)‏ ري Tes‏ 
اختبار مان ويتني PET (Mann Whitney Test)‏ اا ا En eee E E‏ 2 ]1 
اختبار ويلكوكسون لعينتين مرتبطتين (Paired Samples Wilcoxon Test)‏ ...129 
اختبار كروسكال واليز OE 1 1111 (Kruskal Wallis Test)‏ 13 
اختبار ويلكوكسون للمقارنات المتعددة وتصحيح هولم لقيمة المعنوية: O‏ 
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ES (Simple Exponential Smoothing) التمهيد الأسي البسيط‎ 
ANE SE :(Holt's Exponential Smoothing) التمهيد الأسي لهولت‎ 
143... (HOIt -Winters Exponential Smoothing) التمهيد الأسي لهولت ووينترز‎ 
ME e نماذم الانحدار الذاتي والمتوسطات المتحركة التكاملية لبوكس وجينكينل‎ 
00000 (Dif ferencing of Time Series) تحويلة الفرق للسلسلة الزمنية‎ 
148 (Selecting Appropriate ARIMA Model) aloi ARIMA اختيار نموذج‎ 


لفة البرمجة الإحصائية R‏ 


الفصل الأول 
أساسيات لفة 8 
(Principles of R Language)‏ 


(introduction) 40240‏ 
لغة البرمجة الإحصائية R‏ هي )49 مفتوحة المصدر (Open Source)‏ ابتكرها روس إيهاكا 
وروبيرت جنتلمان في جامعة أوكلاند في نيوزيلائدا. ويعود سبب تسميتها بلفة R‏ إلى 

اسم مبتكريها. وقد صدرت أول نسخة مستقرة للفة 8 عام 2000 


إن لغة R‏ مبنية على التوابع (Functional Language)‏ أي أنها مزودة بكم Jilo‏ من 
التوابع التي تحل abao‏ المشاكل التي قد تواجهك. كما أنها )49 برمجة aa‏ ذاتها تتيح 
لك anya‏ إضافة olgil‏ التي قد تناسبك أو التي هي من إبداعك الشخصي. وبإمكانك 
عمل (package) dojo‏ خاصة بك من التوابع والخوارزميات وإضافتها إلى )49 Low) R‏ 
حتى يستفيد منها Aué‏ وهذا هو المقصود بكون R‏ مفتوحة المصدر. 

معرفتك وإتقانك aa‏ البرمجة الإحصائية 8 أحد أهم الميزات التي يمكن أن تضيفها 


لسيرتك الذاتية عندما تفكر بالتقدم إلى عمل في مجال الإحصاء أو عندما تفكر في 
olal‏ الدراسات العليا. 


يعود سبب انتشار لفة R‏ الواسع والسريع إلى عدة نقاط أهمها: 
1- لفة ۴ مجانية. 
aa) -2‏ 8 مفتوحة المصدر (Open Source)‏ 
3- لغة 8 بسيطة وسهلة التعامل والفهم. 
4- لغة 8 تدعم كافة أنظمة التشغيل (Windows, Mac, Linux...)‏ 
بامكانك تحميل نسخة R‏ الخاصة بك من الرابط: httos://cran.r-project.org‏ كما 
بامكانك بعدها تنزيل ain‏ العمل R-Studio‏ وهي بيئة تطوير كثيرة الاستخدام 
والشيوع بين مستخدمي 8 بسبب تبسيطها واختصارها لكتابة الأوامر ولدعمها لميزات 
كثيرة وذلك من الرابط: httos://www.rstudio.com/products/rstudio/download/‏ 
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بعد تنصيبك لبرنامج R-Studio‏ وتشفيله ستجد أن بيئة العمل تنقسم إلى أربعة أقسام: 


Environment History 





القسم الأول الكونسول :Console‏ وفيه يتم تنفيذ الأوامر. وبامكانك كتابة الكود أو الأمر 
الذي تريد تنفيذه ثم الضفط على oi Enter‏ التنفيذ. ولست بحاجة لحفظ التعليمات 
بشكل كامل في ellin ail) R Studio‏ ميزه إكمال العبارات التي يمكنك الاستفادة منها 
بالضغط على زر Tab‏ فتنبثق قائمة لكل الأوامر القريبة من poil‏ الذي Slay‏ بكتابته فتختار 
منها ما تشاء. 


القسم الثاني yoo‏ المصدر Source Editor‏ وفيه يمكن كتابة الأوامر. وتعديلها. وحفظها 
للاستفادة منها لاحقاً, كما يمكنك تنفيذ السطر الذي تشاء aio‏ بالضغط على CtritEnter‏ 
وتستطيع تنفيذ أي yo sjo‏ الكود بتحديده باستخدام الفأرة ثم الضفط أيضاً على 
Ctrl+Enter‏ 


القسم UW!‏ ساحة العمل والحافظة والملفات :Workspace, History and files‏ في ساحة 
العمل يمكن مشاهد المتحولات التي تم تعريفها. وفي الحافظة تظهر الأوامر التي تم 
تنفيذها. كما يمكن إعادة تنفيذ أي تعليمة تريد بمجرد النقر عليها نقرتين متتاليتين. أو 
نقل التعليمة إلى jao‏ المصدر jal‏ على زر Shift‏ مع نقرتين متتاليتين على التعليمة, 


R البرمجة الإحصائية‎ ao) 


أما الملفات وهي اختصار لمستعرض الملفات. ففيها يتم عرض الموقع من القرص الصلب 
والذي يتم العمل فيه. وبإمكانك تغيير الموقع إلى أي مسار تريده. 


القسم الرابع الرسوم البيانية والحزم والمساعدة :Plots, Packages and Help‏ يتم عرض 
جميع الرسوم التي قمت برسمها في Plots‏ ويمكنك التنقل بين هذه الرسوم وحفظهاء 
Lol‏ الحزمة. فهي مجموعة من olgil‏ المعرفة مسبقاً. ويحتوي R‏ على الكثير من الحزم 
الجاهزة التي لم تترك أي جانب من الإحصاء إلا ودخلت (nag ar‏ هذه اللائحة تستطيع 
تنزيل الحزم من الانترنت وإجراء التحديثات وغير ذلك. أما لائحة المساعدة فتقدم لك 
المساعدة عن أي أمر تقوم بكتابته في صندوق البحث. 


فائدة: 


من المواقع المفيدة للبحث عن التعليمات وشرحها موقع www.statmethods.net‏ 
هلاه زاك www.rseek.org lgïlauloig R u a) col) aI‏ 





العمليات الحسابية والمنطقية (Mathematical and Logical Operators)‏ 
Jio‏ أي لفة برمجة أخرى. تجري لفة 8 العمليات الحسابية الأساسية البسيطة. والعمليات 
المنطقية. والموضحة بالجدول الآتي: 





العمليات الحسابية Mathematical Operators‏ 
باقي القسمة والقسمة الصحيحة %/% , 4% 7%/%3=2 , 7993-1 
وللعمليات السابقة أولوية بالتنفيذ كما تم ذكرها بالجدول السابق على الترتيب, إلا أن 
الأقواس في العملية الرياضية لها أولوية التنفيذ Logs‏ 





Jlio 


awl 
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مثال 
((6/)2*)1+2 


الناتج 





سنعرض الآن العمليات المنطقية في R‏ 





Logical Operators العمليات المنطقية‎ 








>3== 

[1] FALSE 
>3!=5 

[1] TRUE 
>3<5 

[1] TRUE 
>3>5 

[1] FALSE 
>3<=5 

[1] TRUE 
>3>=5 

[1] FALSE 

> TRUE&FALSE 
[1] FALSE 

> TRUE | FALSE 
[1] TRUE 

















R البرمجة الإحصائية‎ ao) 


ERF 


إن أي سطر ندخل فيه التعليمات في لفة 8 يبدأ ب > أما سطر النتائج فيبدأ ب [رقم 
النتيجة] وذلك لأن التعليمة قد تعطي أكثر من نتيجة واحدة. 





الكاثنات (Objects)‏ وبعض الملحوظات حول R‏ 

إن ad)‏ ۴ كباقي لفات البرمجة تحتوي أنواع متعددة من المتغيرات., والمتفير هو مكان 
في الذاكرة يمكن تخزين البيانات فيه ويمكن الرجوع له واستخدامه أو تعديله متى „iii‏ 
المتفيرات في R‏ تدعى كائنات (Objects)‏ وهذه الكائنات يتم تخزينها ضمن ما يسمى 
ساحة العمل (Workspace)‏ 


لمعرفة مسار ساحة العمل الحالية نستخدم التعليمة: 


getwd() 
allel ا‎ GEN) (Waal Gain lus eels 


setwd("new path") 
باستخدام التعليمة:‎ aba! التي تم تعريفها حتى‎ GWILSI! بإمكانك معرفة‎ 


Is() 
باستخدام التعليمة:‎ obj ما وليكن‎ WLS كما يمكنك حذف‎ 


rm(obj) 
قواعد يجب الالتزام بها وهي:‎ GUIS! لأسماء‎ 


© يمكن أن يحوي اسم المتغير أي من الأحرف الأبجدية a-b‏ أو A-B‏ أو الأرقام 0-9 أو 
النقطة (.) أو häll‏ السفلي )_( ولا يحوي aul‏ رموز أخرى Jio)‏ @%$..( 

© يبدأ اسم المتفير حصراً بحرف أو نقطة. 

© لو بدأنا اسم المتفير بنقطة فلا يجوز أن يتبع النقطة رقم. 


لو أردنا تخزين القيمة 11 في المتغيرء فيمكن اتباع أحد الطرائق الأربعة ALT!‏ 


c<-11 
11->c 
c=11 





assign(‘c’,11) 
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وللمتفيرات في R‏ أنواع عديدة ومنها المنطقي logical‏ الصحيح integer‏ الرقمي 
numeric‏ المركب complex‏ المحرف character‏ وغيرها. 


لمعرفة نوع متغير ما مثل x‏ يمكن استخدام إحدى التعليمتين: 


typeof(x) | 


class(x) | 


إن R‏ حساسة لحالة الأحرف الكبيرة والصفغيرة (Case Sensitive)‏ أي أن a‏ غير A‏ كما أن 
التعليمة q()‏ غير QQ‏ 


ملاحظة: 
péin‏ المنطقي أحد القیمتین False gi True‏ واختصاراً T‏ و ۴. 


(Vectors) الأشعة‎ 





vw‏ شعة في 8 هي عبارة عن عدة كائنات لها نفس النوع ومخزنة بترتيب محدد. 
يمكن تعريف x clow‏ فيه القيم 3,4,5 بالشكل: 
x<-c(3,4,5)‏ 


Cus‏ يرمز الحرف c‏ إلى الكلمة concatenate‏ والتي تعني “تسلسل”. 
كما يمكن معرفة عدد عناصر الشعاع ‏ بالتعليمة: 


length(x) 


التابعان seq‏ و rep‏ 
أولاً: التابع seq‏ وله الشكل العالم الآتي: 


seq(from,to,by) 


وهو تابع يستخدم لتوليد متتالية من الأرقام من from‏ إلى to‏ وبخطوة رط. فلو أردنا مثلاً 
agi‏ المتتالية: 1,3,5,7,9,11,13,15 نكتب أحد التعليمتين الآنيتين: 


seq(1,15,2) 





po _____seg(from=lto=l5jby=2) OOOO 


R البرمجة الإحصائية‎ Go) 


ملاحظة: 
يمكن توليد متتالية yo‏ العدد from‏ إلى العدد to‏ بخطوة تساوي واحد بالشكل 
المختصر الآتي: 


from:to 
توليد أعداد من 1 إلى 13 نكتب:‎ ito فلو أردنا‎ 
1:13 





ثانياً: التابع rep‏ وله الشكل العام الآتي: 
حيث x‏ هو العنصر أو الشعاع المراد تكراره و each‏ هو عدد مرات التكرار. Hina‏ لتوليد 
لعناصر: 


112233445 56 
Aveuilaull| i 


rep(1:6,each=2) 


agi Lol‏ العناصر: 6 5 4 3 2 1 6 5 4 3 2 1 نكتب: 


rep(1:6,2) 


ولتوليد العناصر: 11 10 8 11 10 10118 8 فنكتب: 


rep(c(8,10,11),3) 


Loi‏ لتوليد العناصر 11 11 11 10 10 8 فنكتب: 


rep(c(8,10,11),1:3) 
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بعض التوابع الرياضية والإحصائية الهامة: 


| الشكل العام ١‏ 





abs 
log 
exp 
sqrt 


factorial 


ceiling 


floor 


trunc 


round 


min 
max 
range 
sum 
mean 
median 
var 


sd 





cos,sin,tan,acos,cosh.,... 


abs(x) 


log(x,base=y) 
exp(x) 
sqrt(x) 


factorial (x) 


ceiling(x) 


floor(x) 


trunc(x) 
round(x, 
digits=n) 
cos(x),Sin(x).,... 
min(x) 
max(x) 
range(x) 
sum(x) 
mean(x) 
median(x) 


var(x) 


القيمة المطلقة 
اللوغاريتم ذو الأساس رل x‏ 
العدد النيبري مرفوعاً للأس x‏ 
جذر× 
عاملي × 
تقريب × لأقرب عدد صحيح ليس أكبر من 


X 


تقريب x‏ لأقرب aac‏ صحيح ليس أصفر من 


x 
x من‎ had إرجاع القسم الصحيح‎ 
بدقة معدداً بعد الفاصلة‎ x تقريب‎ 
x clow أصفر عدد في‎ 
x clow أكبر عدد في‎ 
x clow المدى‎ 
x الشعاع‎ polic مجموع‎ 
x الشعاع‎ polic متوسط‎ 
x الشعاع‎ polic وسيط‎ 
x Clow! polic تباين‎ 
x الانحراف المعياري لعناصر الشعاع‎ 











sd(x) 


الفلترة (Filtering)‏ وبعض التطبيقات على الأشعة: 
نقصد بالفلترة الوصول لبيانات الشعاع التي تحقق lbpi‏ أو عدة شروط. وسنستعرض هذا 


المفهوم من خلال التطبيق الآتي: 
























































بذ ۸ ان کد صن © o wo N‏ 


لت 
Oo‏ 


all 


لفة البرمجة الإحصائية R‏ 


املأ الشعاع x‏ بالقيم 7,5,6,7,8,9,11 

أوجد حجم الشعاع x‏ 

أوجد العنصر الخامس من الشعاع x‏ 

ضع الشعاع x‏ في الشعاع y‏ مضيفاً له القيم 4,8,9,10,13 
اطبع قيم الشعاع y‏ عدا العنصر رقم 12. 

اطبع أول 3 قيم من الشعاع ن. 

اطبع القيمة الأولى والخامسة والتاسعة من الشعاع ن. 
استبدل القيمة الأولى من الشعاع y‏ بالقيمة 12 

استبدل القيمة الثالثة من الشعاع y‏ بمربعها. 


. استبدل Jol‏ 3 قيم من الشعاع y‏ بالقيمة 7. 


استبدل القيمة السابعة والثامنة والتاسعة من الشعاع y‏ بالقيم 7,8,9 


. أوجد معكوس الشعاع y‏ 

. استبدل القيم التي هي أكبر من 8 في الشعاع y‏ بالقيمة 4. 

Y قيم من الشعاع‎ 9 jòl obl. 

. أضف للعناصر الزوجية في الشعاع ن القيمة 1. 

. استبدل العناصر الفردية التي هي أقل من 7 بالقيمة 2 

. أوجد US‏ من المجموع والمتوسط والوسيط والانحراف المعياري والانحراف 


المتوسط coid‏ ن. 


. أسند نصف قيم الشعاع y‏ للشعاع x]‏ والنصف الآخر للشعاع x2‏ 
alg .‏ الشعاع rp‏ المكون من العناصر 33333344555 2 2 2 2 1112 بطريقة 


مختصرة. 
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> x<-c(7,5,6,7,8,9,11) 

> length(x) 

> x[5] 

> y<-c(x,4,8,9,10,13) 

> y[-12] 

y[4:3] 

> y[c(1,5,9)] 

> y[1]=12 

> y[3]=y[3]^2 

10 Babee, 

11 BAA IEE TAO) 

12 EAG) 

13 Bea Wee he 

14 > y[(length(y)-8):length(y)] 

15 > y[y%%2==0]<-y[y%%2==0]+1 
16 
> sum(y) 

>mean(y) 

>median(y) 

>sd(y) 

> sum(abs(y-mean(y)))/length(y) 
> x1<-y[1:6] 

> x2<-y[7:12] 

19 > rp<-c(rep(1,3),rep(2,5),rep(3,6),rep(4,2),rep(5,3)) 


حم نح يبن اط CON OU‏ 
Vv‏ 


wo 
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التعليمة subset‏ 
يمكن استخدامها للوصول إلى بيانات الشعاع التي تحقق شرطاً aaao‏ ولها الشكل: 





subset(object, condition) | 


Hing‏ إذا Uzi‏ عرض بيانات الشعاع x‏ التي هي أكبر من 5 والتي هي yo‏ مضاعفات العدد 
a‏ 


subset(x,x>5 & x%%4==0) | 


ملاحظة: 


يمكن إجراء العمليات الحسابية على شعاعين goal andi duo x,y‏ أو الطرح أو الضرب 
أو القسمة إجراء كل من هذه العمليات عنصرأً لعنصر,. Lol‏ لإيجاد الجداء الداخلي فنكتب: 
x%*%y‏ 
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المصفوفات (Matrices)‏ 
يمكن تعريف مصفوفة عناصرها elements‏ مكونة من nrow‏ سطراً 9 ncol‏ عموداً 
بالشكل: 


matrix(elements,nrow,nclo) |‏ 
فلتعريف المصفوفة الآتية -Ilio‏ 


NONU 
00 Neu 
ONNO 


نكتب أحد التعليمات المتكافئة الآتية: 


matrix(c(3,2,8,7,5,1,7,8,6,7,2,9),4,3) 
matrix(c(3,5,6,2,1,7,8,7,2,7,8,9),4,3, byrow=T) 


matrix(c(3,2,8,7,5,1,7,8,6,7,2,9),c(4,3)) 
matrix(c(3,5,6,2,1,7,8,7,2,7,8,9),c(4,3),byrow=T) 


والعمليات الحسابية الأربعة (الجمع والطرح والضرب والقسمة) تعني إجراء كل من هذه 
العمليات عنصراً لمنصر, أما لإيجاد الجداء حسب مفهوم جداء مصفوفتين فنكتب: 





A %*% 8 | 


بعض التوابع المستخدمة مع المصفوفات: 


الدالة الشكل العام الوظيفة 
solve(A) solve‏ مقلوب المصفوفة A‏ 
A da94n0 Jgadio t(A) t‏ 
det(A) det‏ 2220 مصفوفة A‏ 

















يمكن إجراء عمليات الفلترة على المصفوفات كما أجريناها على الأشعة. 
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التعليمة ‘apply‏ 
للتعليمة apply‏ الشكل العام الآتي: 


apply(a,row_or_column,statement) |‏ 
Jio‏ الوسيط الأول المصفوفة المستخدمة, lol‏ الوسيط الثاني فياخذ lol‏ 1 للدلالة على 
التعامل مع الأسطر أو 2 للدلالة على التعامل مع الأعمدة. والوسيط الثالث نضع به 
التعليمة التي نريد تطبيقها على كافة الأسطر أو الأعمدة. 


فلو أردنا إيجاد مجموع كافة أسطر المصفوفة A‏ نكتب: 


apply(A,1,sum) |‏ 
ولو أردنا إيجاد متوسط كافة أعمدة المصفوفة A‏ نكتب: 


apply(A,2,mean) | 


التعامل مع الأسطر والأعمدة: 
سنورد فيما يلي أهم التعليمات التي يمكن استخدامها مع المصفوفات والتعامل مع 
أسطرها وأعمدتها: 
Afr, ]‏ أخذ السطر رقم yor‏ مصفوفة A‏ 
AL, c]‏ أخذ العمود رقم c‏ من المصفوفة A‏ 
rbind(A,X)‏ إضافة X clow‏ كسطر جديد للمصفوفة A‏ 
cbind(A,X)‏ إضافة X clow‏ 39005 جديد للمصفوفة A‏ 
diag(A)‏ الحصول على jolie‏ القطر الرئيسي للمصفوفة A‏ 
agi diag(X)‏ مصفوفة قطرية قطرها الشعاع × وباقي polio!‏ أصفار 
eigen(A)‏ إيجاد القيم الذاتية والأشعة الذاتية لمصفوفة مربعة ۸ 
eigen(A)Svalues‏ إيجاد القيم الذاتية لمصفوفة مربعة A‏ 
eigen(A)$vectors‏ إيجاد الأشعة الذاتية لمصفوفة مربعة A‏ 
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ملاحظة: 
يمكن إضافة أسماء لأسطر وأعمدة المصفوفة × باستخدام التعليمتين colnames‏ و 
gla rownames‏ كانت لدينا Yo Gagano‏ ثلاثة أسطر وثلاثة أعمدة slawi‏ أعمدتها 


3 وأسماء أسطرها ۶1,٨2,٨2‏ يمكننا إضافة هذه الأسماء بالشكل: 
colnames(x) <- c("C1","C2","C3")‏ 


rownames(x) <- c("R1",”Re”,"R3") 





A 
المصفوفة:‎ WJ لتكن‎ 
2 8 6 
lT 
DS 
78 9 
والتي يمكن تعريفها بالشكل:‎ 





y<-matrix(c(3,2,8,7,5,1,7,8,6,7,2,9),4,3) 
اطبع عناصر السطر الثالث.‎ 1 


obl 2‏ عناصر العمود الثاني. 
3. استبدل عناصر السطر الأول بالقيم 9 7 4. 
4. أنشمئع ثلاثة أشعة yl y2 y3‏ بالاستعانة بالعمود الأول والثاني والثالث من 
المصفوفة السابقة على الترتيب. 
أضف العمود 2 4 3 1 للمصفوفة السابقة. 
أضف السطر 9 8 7 2 للمصفوفة السابقة. 
أوجد المتوسط الحسابي للسطر الثاني للمصفوفة ن. 
أوجد المتوسط الحسابي لكل أعمدة المصفوفة y‏ 


on © 
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| الالو اا 
yi3, [‏ 
yl, 2]‏ 

y[1, ]<-c(4,7,9) 
yi<-y[, 1] 
y2<-y[, 2] 
y3<-y[, 3] 

y<-cbind(y,c(1,3,4,2)) 
y<-rbind(y,c(2,7,8,9)) 
mean(y[2, [( 
apply(y,2,mean) 


A wW Nhe 


كنا الت اك o‏ 
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الفصل الثاني 
القوائم وأظر البيانات 
(Lists and Data frames)‏ 
القوائم (Lists)‏ 
القائمة (List)‏ هي تجمع )220 من البيانات مختلفة الأنواع. ولتعريف قائمة اسمها Ist1‏ 
فيها العناصر a=2.5‏ و b=True‏ و c=1:3‏ نكتب التعليمة: 


Ist1<-list(“a”=2.5, “b”=T, “c’=1:3) 
الناتج:‎ 





53 
[1] 2.5 


م5 
TRUE‏ ]1[ 


Sc 
[1]123 








ملاحظة: 
يمكن استخدام التعليمة str(Ist1)‏ لإعطاء معلومات تفصيلية عن القائمة Asti‏ 


ملاحظة: 


يمكن تعريف Ist1‏ بالشكل enalSod!‏ الآتي: 
x<-list(2.5,T,1:3)‏ 
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الوصول لعناصر القائمة: 
لنعرف القائمة الآتية: 


x<-list(“name”="bisher”,”age”=26,” marks”=c(90,92,94)) 
ستخدام أي تعليمة من التعليمات المتكافئة الآتية:‎ wl يمكن‎ name للوصول للحقل‎ 





x[1] |‏ 
x[[1]]‏ 
x[“name”] |‏ 
x[[“name”]] |‏ 
xSname |‏ 
x$n |‏ 
كما يمكن الوصول للعلامة 92 بأحد الأشكال الآتية: 





x[[3]][2] 


x$m[2] 
x$marks[2] 





إطار البيانات (Data Frame)‏ 
يمكن تعريف إطار البيانات Data frame‏ على أنه جدول يحتوي عدة أسطر وعدة أعمدة 
حيث يمثل كل agac‏ نوع محدد من البيانات وكل سطر بيانات فرد محدد كما في المثال 


الآتي: 
Name Married Average‏ 
Auday False 75‏ 
Omar True 77‏ 
Ahmed False 80‏ 
Ammar False 81‏ 














لإدخال الجدول السابق في Data Frame‏ نكتب: 


Name<-c("Auday","Omar","Ahmed","Ammar") 
Married<-c(F,T,F,F) 


Average<-c(75,77,80,81) 
tbl<-data.frame(Name, Married,Average) 
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يمكن تعديل الجدول السابق باستخدام محرر إطار البيانات بسهولة وديناميكية أكثر 
باستخدام التعليمة: 


يمكن إيجاد إحصاءات dole‏ حول Data Frame‏ السابقة بالشكل: 


summary(tbl) 
الناتج‎ 
Name Married Average 
Ahmed:1 Mode : logical Min. :75.00 
Ammar:1 FALSE:3 1st Qu.:76.50 
Auday:1 TRUE :1 Median :78.50 
Omar :1 NA's 0 Mean _ :78.25 
3rd Qu.:80.25 
Max. :81.00 








للوصول للسطر رقم r‏ نكتب: 


للوصول للعمود رقم c‏ نكتب: 


للوصول للعمود الذي اسمه col‏ تنكتب: 





مثلا: 
tbISName |‏ 


التعليمة View‏ والتعليمة stack‏ 
yo‏ التعليمات المفيدة nuig‏ يمكن استخدامها مع Data Frame‏ هي التعليمة View‏ 
والتي تقوم بعرض بيانات ال Data Frame‏ بشكل منسق في نافذة مستقلة, lol‏ التعليمة 


stack‏ فالهدف منها تجميع بيانات Data Frame‏ في عمودين الأول هو البيانات والثاني 
هو تسميات هذا البيانات. فمثلاً لو كان لدينا: 


30 35 37 
31 | 34 | 38 
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التعليمة View‏ تجعل عرض البيانات السابقة بالشكل الآتي: 





باستخدام التعليمة stack‏ تصبح ال Data Frame‏ من الشكل: 

















values | ind 
30 X1 
31 X1 
31 X1 
35 X2 
34 X2 
36 X2 
E 
38 X3 
38 X3 





استيراد panig‏ البيانات ‘(Importing and Exporting Data)‏ 
سنبداً Doi‏ باستيراد البيانات حيث توجد عدة تعليمات لاستيراد البيانات إلى 8 وذلك باختلاف 
المصدر الذي نريد استيراد البيانات منه. 


-لنفترض أننا نريد استيراد البيانات التي هي في الفرص D‏ وذات الاسم Data‏ 


dpi UT أولاً:‎ 





8 التعليمة في‎ 
mydata >- read.table("d:/data.csv", header=TRUE,sep=",") لاوح‎ # 
library(xlsx) wise Excel 
mydata <- read.xlsx("d:/ data.xlsx", sheetName = "mysheet") 

library(Hmisc) 

mydata <- spss.get("d:/ data.por", use.value.labels=TRUE) Ree al a 
library(Hmisc) 

mydata <- sasxport.get("d:/data.xpt") aot a 
library(foreign) dta Stata 











mydata <- read.dta("d:/data.dta") 
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الآن ننتقل إلى تصدير البيانات حيث توجد عدة تعليمات لتصدير البيانات من 8 وذلك باختلاف 
النمط الذي نريد تصدير البيانات وفقه. 


-لنفترض أننا نريد pans‏ البيانات المخزنة في الكائن mydata‏ إلى القرص D‏ وباسم Data‏ 





write.table(mydata,"d:/data.csv",sep=",") لاوح‎ # 


library(xlsx) 
write.xlsx(mydata, "d:/data.xlsx") 
library(foreign) 
write.foreign(mydata, "d:/data.txt", "c:/data.sps", sps SPSS 
package="SPSS") 
library(foreign) 
write.foreign(mydata, "d:/data.txt", "d:/data.sas", sas SAS 
package="SAS") 
library(foreign) 
write.dta(mydata, "d:/data.dta") 
Syntax أولاً ثم كتابة‎ txt البيانات كنسخة‎ pani يفتضي‎ SAS أو‎ SPSS البيانات ل‎ pans إن‎ 


للبرنامج المستهدف حتى تتم قراءة البيانات yo‏ ملف ال txt‏ 


xlsx Excel 


dta Stata 
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الفصل الثالث 
العبارات الشرطية والعبارات التكرارية والتوابع 
(Conditional Statements, Loops and functions)‏ 


العبارة الشرطية lf‏ 
تستخدم العبارة الشرطية if‏ عندما نرغب بتنفيذ تعليمة محددة أو عدة تعليمات 
65 عندما يتحقق شرط أو عدة شروط conditions‏ ولها الشكل العام الآتي: 


ei Le) 


{ 


statements 


} 
ولها شكل أعم. وهو تنفيذ كتلة تعليمات statements]‏ في حال تحقق الشروط 


51١‏ وتنفيذ كتلة التعليمات statementse‏ في حال عدم تحققها: 





Cee Len) 
{ 


statements1 
} else 


{ 


statements2 


} 
من الشروط مقروناً بتعليمات خاصة به وذلك بالشكل الآتي: 





if(conditions1) 

{ 

statements1 

} else if(condition2) 


{ 
statements2 
} else if (condition3) 
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برنامج يقوم بطباعة Negative‏ إذا كان العدد المدخل „Ww‏ ويطبع Positive‏ إذا كان العدد 
المدخل Logo‏ ويطبع صفر فيما عدا ذلك: 


> x<-0 

> if (x<0) 

+1 

+ print("Negative") 
+ } else if(x>0) 

+{ 

+ print("Positive") 

+ } else print("Zero") 


ملاحظة: 

الرمز + في بداية الأسطر من الثالث إلى الأخير تعني أن التعليمة لم aii‏ وهنا يجب أن 
نشير إلى أنه علينا ألا نكتب else‏ إلا بجوار القوس ولا نفردها بسطر وحدها وإلا اعتبرت 
yi R‏ الكود انتهى. 





التابع ‘ifelse‏ 
للتابع ifelse‏ الشكل العام الآتي: 


ifelse(condition,x,y) | 


وهو تابع يفحص العبارة المنطقية condition‏ فإذا كانت نتيجتها TURE‏ ينفذ التعليمة X‏ 
وإذا كانت نتيجتها FALSE‏ ينفذ التعليمة لا. 


a <-c(5,7,2,9) 


ifelse(a %% 2 == 0,"even","odd") 





"odd" "odd" "even" "odd" 
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العبارة Switch‏ 
للتعليمة switch‏ الشكل العام الآتي: 


switch(statement, list) | 


حيث يتم إرجاع قيمة من القائمة list‏ بالاعتماد على قيمة ‘ind statement‏ 


switch(2, "red" = peor "blue") 


green"" 


للا سس الل 


switch("color", "color" = "red", "shape" = "square", "length" = 5) 


red"" 














حلقة التكرار For‏ 
ac‏ التكرار for‏ الشكل العام الآتي: 


for(i in start:end) 


{ 


Statements 


} 





أ: العداد. 

:start‏ نقطة البداية. 

:end‏ نقطة النهاية. 

15 التعليمات المراد تكرارها. 


تقوم تعليمة for‏ بتكرار التعليمات Statements‏ بعدد yo‏ المرات يساوي .end-start+]‏ 
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مثال: لتكن المصفوفة: 


والمطلوب: 


دہ ت کج ص © )ا o‏ 





إدخال المصفوفة. 

طباعة عناصر القطر الرئيسي. 

طباعة عناصر القطر الثانوي. 

طباعة العناصر التي هي فوق القطر الرئيسي. 

طباعة العناصر التي هي فوق القطر الرئيسي مع القطر الرئيسي. 
طباعة العناصر التي هي تحت القطر الرئيسي. 

طباعة العناصر التي هي فوق القطر الثانوي. 

طباعة العناصر التي هي تحت القطر الثانوي مع القطر الثانوي. 


a ee |||‏ ين 
>x<-matrix(c(1,2,4,5,7,3,6,6,7),3)‏ .1 
for (i in 1:3)‏ > 
print(x[i,i])‏ + 
gl‏ 
-diag(x)‏ 
for (i in 1:3)‏ > 
print(x[i,3-i+1])‏ + 
for (i in 1:2)‏ > 
print(x[i,(i+1):3])‏ + 
for (i in 1:3)‏ > 
print(x[i,i:3])‏ + 
for (i in 2:3)‏ > 
print(x[i,1:(i-1)])‏ + 
for (i in 1:2)‏ > 
print(x[i,1:(3-i)])‏ + 
for (i in 1:3)‏ > 
print(x[i,(3-i+1):3])‏ + 








33 |Page 


























محمد بشر زينه 


حلقة التكرار while‏ 
قة التكرار while‏ الشكل العام الآتي: 


while(conditions) 


{ 


statements 


} 





:conditions‏ شروط uåi‏ الحلقة. 
ul ‘statements‏ ل ات التي re‏ .© . في JI . fi sone boy soe - Jb‏ | 532 6 


والبرنامج الآتي يطبم الأعداد من 1 إلى 9: 


> i<-1 

> while (i<10) 
+{ 

+ print(i) 

+ i=i+1 


+} 





التعليمتان next g break‏ 
الآتي يطبع الأعداد من 1 إلى 10 ويتوقف عن الطباعة عند أول عدد زوجي من Glacl4o‏ 
العدد 3: 


> for (iin 1:10) 
+1 


+ if (i~4%2==0 & i%%3==0) break 
+ print(i) 
+} 





go lo GAl5 cp lou cpl اتان‎ audit Wold next إلا‎ prAiuy loin 
و 25 والتي تقبل‎ ١ الخروج من الحلقة. والبرنامج الآتي يقوم بطباعة الأعداد الوافعة بين‎ 
ا‎ oe nen از‎ 
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> for (iin 1:25) 
+{ 


+ if (i%%3!=0) next 
+ print(i) 
+} 





حلقة ‘repeat‏ 
وهي حلقة يجب استخدام التعليمة break‏ معها حصراً لإيقاف تنفيذها. ولها الشكل العام 
الآتي: 


repeat 


0 


statements 


} 





البرنامج الآتي يطبم الأعداد من 1 إلى 10 


> i<-1 
> repeat 


+1 


+ print(i) 
+ if (i==10) break 
+ i<-i+1 


+} 
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خلاصة الحلقات التكرارية الثلاثة: 

© الحلقة for‏ تكرر التعليمات Statements‏ طالما أن العداد ضمن المجال seq‏ المحدد له. 
8 الحلقة while‏ تكرر التعليمات Statements‏ طالما أن by‏ التنفيذ Condition‏ محقق. 
© الحلقة repeat‏ تتنفذ مرة واحدة على الأقل إلى أن يتحقق شرط الخروج Condition‏ 


وهذا ما يوضحه الشكل الآتي: 
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التوابع (Functions)‏ 
تستخدم التوابع لتقسيم الكود إلى عدة أجزاء بسيطة مما يسهم في تبسيط الكود 
وفهمه أكثر, ويعرف التابع بالشكل الآتي: 


func_name <-function(arguments) 


{ 


statements 


} 





حيث: 
:Func_name‏ اسم التابع. 
:arguments‏ وسطاء التابع. 
15 تعليمات. 


الشكل التوضيحي الآتي يساعد على فهم أبسط للتوابع: 


INPUT x 
+ 


FUNCTION f: 


OUTPUT f(x) 
ليجري‎ FUNCTION f وسطاء التابع وهي المدخلات التي سنعطيها للتابع‎ INPUT تمثل‎ 


عليها تعليمات Statements‏ محددة ثم يعطينا المخرجات OUTPUT‏ وهي تحمل اسمه 
f(x)‏ 


© ع 223 | 37 
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oli‏ يستفيد من تابعين لحساب معامل الالتواء لعينة × بالاعتماد على القانون: 


2 
Skew = as 
U2 


zy 
U2 = oe 
c= 


E 
U3 = 75 
t= 


> mu2<-function(x) 

+{ 

+ sum((x-mean(x))42)/length(x) 
+} 

> mu3<-function(x) 


+{ 


+ sum((x-mean(x))^3)/length(x) 
+} 
> skew<-function(x) 
+1 
+ mu3(x)42/mu2(x)43 
ae 
مع التوابع التي تعيد قيمة محددة كما في المثال‎ return ويفضل استخدام التعليمة‎ 





الآتي حيث سنعرف lol‏ اسمه check‏ يعيد إما Positive‏ أو Negative‏ أو Zero‏ حسب 


العدد المدخل: 


> check <- function(x) { 
if (x>0) { 
return("Positive") 
} 
else if (x<0) { 
return("Negative") 
} 
else { 
return("Zero") 
} 
} 


+ 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
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ملاحظة: 
التابع هو بنية تعيد قيمة وحيدة فقط (Object)‏ وإذا أردنا إعادة أكثر من قيمة يمكن 
جعل التابع يعيد قائمة ilio (List)‏ أو أي نوع آخر. 


Jlio 





> multi_return <- function() { 

+ my_list <- list("color" = "red", "size" = 20, "shape" = "round") 
+ return(my_list) 

+} 

> a <- multi_return() 

>a 








owl 
Scolor 
[1] "red" 


Ssize 
[1] 20 


Sshape 
[1] "round" 
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الفصل الرابع 
الأصناف 


(Classes) 


إن R‏ تدعم البرمجة كاثنية التوجه. بل إن كل شيء في R‏ هو عبارة عن كائن. نستطيع 
وصف ال Class‏ على أنها بنية معطيات تمتلك خواصاً وتوابع خاصة (طرائق) (methods)‏ 


نستطيع Ja‏ ال Class‏ على أنها مخطط هيكلي لمنزل وهذا المخطط يحوي جميع 
تفاصيل المنزل من أرض وسقف وأبواب وشبابيك و .... وبالاعتماد على هذه التفاصيل 
نستطيع بناء المنزل. 

المنزل الذي نبنيه بالاعتماد على هذه ال Class‏ هو ال Object‏ المشتق منها. وبالطبع 
الكائنات المتعددة من ال Class‏ الأساسية. 

الفرق في R‏ عن nal‏ لفات البرمجة أنها aca‏ ثلاثة أنواع من الأصناف وهي S3‏ و 54 و 
الأصناف المرجعية. 

coin!‏ 53 هو أبسط أنواع الأصناف وتعريفه Ino buw‏ وليس له شكل تصريح رسمي إنما 
يتم باستخدام كلمة class‏ فقط Jos loo‏ استخدامه شائعاً في R‏ ويمكن تعريف cain‏ 
اسمه Student‏ يملك المكونات average=88g age=21g name=John‏ بالشكل الآتي: 


s <- list(name = "John", age = 21, GPA = 3.5) 





class(s) <- "student" 
الصنف $4 هو تحسين على الصنف $3 وله شكل تصريح رسمي يسهل عملية إنشاء كاثنات‎ 
تعريف مكونات الصنف باستخدام‎ aig من نفس الصنف تكون أقل أو أكثر شبهاً به.‎ 
الصنف السابق‎ newl) باستخدام التعليمة‎ aio إنشاء كائنات‎ og setClass() التعليمة‎ 
يصبح بالشكل:‎ 


setClass("student", slots=list(name="character", age="numeric", 





average="numeric")) 


R البرمجة الإحصائية‎ ao) 


الأصناف المرجعية تمت إضافتها a‏ إلى 8 وهي أكثر شبهاً بالأصناف في لفات البرمجة 
كائنية التوجه مقارنة مع الصنفين السابقين. ويمكن تعريفها على أنها أصناف 54 ببيئة 
خاصة مضافة lg‏ وتعرف بالشكل الآتي: 


setRefClass("student") 


وسنشرح فيما يلي أنواع الأصناف السابقة بالتفصيل: 

الصنف 53: 

كما سبق Wag‏ إن hail‏ $3 هو أكثر أنماط الأصناف انتشاراً في R‏ ومعظم الأصناف 
مسبقة التعريف في R aa)‏ هي من النوع 53 ويعود ذلك لسهولة استخدام هذا boil‏ 


ليس لهذا hoill‏ صيفة رسمية لتعريفه معرفة مسبقاً في لفة R‏ لكن نستطيع أن Jodi‏ 
إن القائمة (List)‏ المسندة Class ow)‏ محددة هي yo WIS‏ النوع 53. وعندها تكون 
مركبات القائمة هي أعضاء الصنف الجديد المعرف. 

ls Sa 


s <- list(name = "bisher", age = 27, avg = 96) 
class(s) <- "student" 





إلا اتج 
Is‏ 

$name 

[1] " bisher " 


Sage 
[1] 27 


Savg 
[1] 96 


attr(,"class") 
[1] "student" 








استخدام المشيدات Constructors‏ لإنشاء الكائنات: 
من المفيد استخدام توابع تحمل نفس اسم ال Class‏ لإنشاء LISS!‏ والذي سيعطينا 
انتظاماً لإنشاء الكاثنات وجعلها تبدو متشابهة. 
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Ẹ 
: 


Jl 5 
student <- function(n,a,av) { 
if(av>100 | | av<0) stop("avg must be between 0 and 100") 
value <- list(name = n, age = a, avg = av) 
attr(value, "class") <- "student" 
value 
} 

استخدمنا في المثال السابق التابع value Joa attr)‏ يتبع student cain‏ وهي 


تكافئ تعليمة .class(value)<-student‏ 








فيما يلي النواتج المختلفة باختلاف المدخلات للمثال السابق: 


ظ 


5 >- student("Paul", 26, 77) 
5 


Sname 
[1] "Paul" 


Sage 
[1] 26 


Savg 
[1] 77 


attr(,"class") 
student"" [1] 





s<-student("Paul",25,105) 






الناتج 
Error in student("Paul", 25, 105) : avg must be between 0 and 0‏ 
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الطرائق والتوابع العامة (Methods and Generic Functions)‏ 
لاحظنا في الأمثلة السابقة أننا وبمجرد $55 اسم الكائن تتم طباعة كافة محتوياته. وذلك 
يتم باستدعاء تلقائي للتابع print)‏ 


يمكننا lay!‏ استخدام التابع print()‏ مع الأشعة vectors‏ والمصفوفات matrices‏ وأطر 
البيانات data frames‏ و.... والسؤال الآن: كيف يعرف print() ail‏ كيفية طباعة هذه 
الكاثنات Li . JI‏ .اعم وغير feo JI‏ ابهة؟؟! 


الجواب: إن ai print)‏ عام generic function‏ أي أنه تابع يمتلك العديد من الطرائق 
ويمكنك معرفتها باستخدام التعليمة: 

ومن الطرائق التي يمتلكها التابع printQ)‏ نجد print.dataframe Iio‏ وبالتالي عند 
استدعاء التابع print)‏ مع data frame‏ يتم إرسال التعليمة إلى الطريقة 
print.data.frame()‏ 


أي أن الشكل العام للطرائق هو: 
أي أن استدعاءنا للكائن yo‏ الصنف student‏ ينبغي أن يستدعي طريقة من الشكل 


.print.student()‏ لكن هذه الطريقة ليست موجودة! إذأ ما هي الطريقة التي يستدعيها 
الكائن من الصنف ISSstudent‏ 


إن الطريقة التي يستدعيها WISI!‏ من الصنف student‏ هي print.defaultQ‏ والتي 
نسميها الطريقة الاحتياطية أو الافتراضية والتي يتم استدعاؤها عند عدم وجود مطابقة 
مع المطلوب استدعاؤه. 





الكود الآتي يقوم بتضمين طريقة جديدة ‘student owl‏ 


print.student <- function(obj) { 
cat(objSname, "\n") 


cat(objSage, "years old\n") 
cat("Average:", objSavg, "\n") 
} 
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وعند طباعة Gugino‏ الكائن من النوع student‏ سوف تتنفذ هذه الطريقة مباشرة. 


في الأصناف من hail‏ 53 لا تنتمي الطرائق إلى كائن محدد أو cain‏ محدد loil‏ تنتمي 
إلى التوابع العامة generic functions‏ 


كيف يمكننا كتابة ail‏ عام pl generic function‏ بنا؟ 


يجب أن aloj‏ أن التابع العام هو تابع يملك استدعاء التابع UseMethod()‏ مع تمرير اسم 
التابع له. والذي يمثل التابع الفرسِل الذي glow‏ جميع التفاصيل. 


سنعرف الآن lole Losi‏ اسمه grade‏ وذلك بالشكل الآتي: 


grade <- function(obj) { 


UseMethod("grade") 
} 
ولذلك سنعرف الطريقة الافتراضية‎ a بطرائق خاصة‎ aby ليس للتابع العام أي فائدة بدون‎ 
‘Ul 





grade.default <- function(obj) { 
cat("This is a generic function\n") 


ee 
‘student ثم سنعرف طريقة خاصة بالصنف‎ 





grade.student <- function(obj) { 


cat("Your average is", objSavg, "\n") 


} 





«lug‏ عليه يكون الناتج: 
grade(s)‏ > 
Your average is 77‏ 


الصنف 54: 

ما يميز الصنف 54 عن الصنف 53 هو أن للأصناف من coill‏ 54 )339.0 محدد لتعريفهاء 
وذلك يتم بالاعتماد على التابع setClass()‏ ونسمي المتحولات الأعضاء للصنف owl‏ 
الشرائح (Slots)‏ ولتعريف الصنف student‏ الذي له الشرائح avgg ageg name‏ نكتب: 


setClass("student", slots=list(name="character", age="numeric", avg="numeric")) 
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أما إنشاء GUIS‏ من الصنف 54 فيتم باستخدام التابع newl)‏ وفق الشكل الآني: 





s <- new("student", name="John", age=21, avg=88) 
‘WI! ygSuws وعند طباعة الكائن‎ 
An object of class "student" 


Slot "name": 
[1] "John" 


Slot "age": 
[1] 21 


Slot "avg": 
[1] 88 


ملاحظة: 
يمكننا التأكد فيما إذا كان yilS‏ ما من hail‏ $4 باستخدام التابع المنطقي isS4Q)‏ 
فیعید التابع TRUE‏ ]15 كان الكاثن من FALSE aog $4 càin‏ فيما عدا ذلك. 





إن التابع Iago lol aos setClass()‏ له عمل يشابه كثيراً عمل المشيدات ويستخدم 
لإنشاء GUIS‏ جديدة. فلو كتبنا: 


student <- setClass("student", slots=list(name="character", age="numeric", 
avg="numeric")) 


loli WJ awi‏ مولداً اسمه student()‏ نستطيع استخدامه في إنشاء SUIS‏ 62429 من 
الصنف student‏ كما في المثال الآتي: 





ا 


student(name="John", age=21, avg=85) 





الناتج 
An object of class "student"‏ 
Slot "name":‏ 
"John"‏ ]1[ 


Slot "age": 
[1] 21 


Slot "avg": 
[1] 85 








45|Page 





محمد بشر زينه 


يمكننا الوصول إلى شرائح الكائن باستخدام المعامل 5 ‘ind‏ 





[1] "John" 


كذلك بإمكاننا التعديل على الشرائح بنفس الأسلوب كما يلي: 


ظ 


S@avg <- 7 
5 

الناتج 
An object of class "student"‏ 


Slot "name": 
[1] "John" 


Slot "age": 
[1] 21 


Slot "avg": 
[1] 77 








كما يمكن إجراء التعديل باستخدام التابع slotQ‏ كما يلي: 


ظ 


slot(s,"name") <- "Paul" 
5 

al 
An object of class "student" 


Slot "name": 
[1] "Paul" 


Slot "age": 
[1] 21 


Slot "avg": 
[1] 77 
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(Methods and Generic Functions) الطرائق والتوابع العامة‎ 

لاحظنا في المثال السابق أن مجرد كتابة اسم الكائن s‏ أدت إلى طباعة e105‏ محتوياته, 
وذلك يتم بفضل التابع العام show()‏ والذي يشابه التابع print)‏ في الصنف من النمط 
53 


وبنفس التسلسل الذي اتبعناه في الصنف من النمط 53 سنعرض الآن طريقة تعريف 
طرائقنا الخاصة للأصناف من النمط 54: 
لنعرف الآن الطريقة العامة show()‏ على سبيل المثال: 


setMethod("show", 
"student", 
function(object) { 
cat(object@name, "\n") 


cat(object@age, "years old\n") 
cat("avg:", object@avg, "\n") 
} 





والمثال الآني يوضح الاختلاف بعد التعريف السابق: 





aei 
s <- new("student",name="John", age=21, avg=90) 
5 

al 
John 
21 years old 
avg: 90 








وبهذا الأسلوب نستطيع GUS‏ طرائق الصنف $4 للتوابع العامة. 
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الأصناف المرجعية (Reference Classes)‏ 
لاحظنا في كل من الأصناف من النمط 53 والأصناف من النمط 54 أن الطرائق تنتمي إلى 
olgil‏ العامة (Generic Functions)‏ لكن في الأصناف المرجعية تنتمي الطرائق إلى 
الصنف بحد ذاته مما يجعلها أقرب إلى البرمجة كاثنية التوجه كما في لفات البرمجة 


C++, Java... 


يمكننا تعريف صنف مرجعي باستخدام التابع setRefClass()‏ ونسمي الأعضاء التابعة 
للأصناف المرجعية بالحقول (Fields)‏ ولتعريف cain‏ مرجعي اسمه student‏ فيه 
الحقول name,age,avg‏ نكتب: 


setRefClass("student", fields = list(name = "character", age = "numeric", avg = 





"numeric")) 
من الصنف المعرف:‎ GUIS يستخدم لتوليد‎ lugo loul يعيد‎ setRefClass() إن التابع‎ 


T 


student <- setRefClass("student", 
fields = list(name = "character", age = "numeric", avg = "numeric")) 
s<-student(name = "John", age = 21, avg = 63) 
5 
al 
Reference class object of class "student" 
Field "name": 
[1] "John" 
Field "age": 
[1] 21 
Field "avg": 
[1] 63 





يمكننا الوصول إلى حقول الكاثن باستخدام المعامل $ ‘Hind‏ 


[1] "John" 
كذلك بإمكاننا التعديل على الشرائح بنفس الأسلوب كما يلي:‎ 
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ظ 


s@name <- "Rami" 
5 
ail 
Reference class object of class "student" 
Field "name": 
[1] "Rami" 
Field "age": 
[1] 21 
Field "avg": 
| [1] 63 








ملاحظة هامة: 
عند إسناد كائن إلى متحول جديد فإن عملية الإسناد تتم بالقيمة (by value)‏ فمثلا: 


ظ 


3 g: list("x" z 1, "y" = 2) 
b<-a 
bSy =3 








الناتج 








أي أن التغيير طرأ على b‏ فقط alg‏ يطرأ أي تغيير على قيم a‏ وهذا يعرف بالمرور بالقيمة, 
لكن هذا الكلام لا ينطبق على الكاثنات المرجعية. حيث توجد نسخة وحيدة من „Wl‏ 
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وكل المتحولات الأخرى تشير لنفس الكائن. ومن هنا أتت Grows‏ الأصناف المرجعية بهذا 
الاسم. وسنوضح هذا بالمثال الآتي: 


ا 
a >- student(name = "John", age = 21, avg = 75)‏ 
b<-a‏ 
bSname <- "Paul"‏ 

a 
| b 
الناتج‎ 


| Reference class object of class "student" 
Field "name": 
[1] "Paul" 
Field "age": 
[1] 21 
Field "avg": 
[1] 75 


Reference class object of class "student" 
Field "name": 

[1] "Paul" 

Field "age": 

[1] 21 

Field "avg": 

| [1] 75 








ونلاحظ أن تعديلنا على b‏ أدى إلى تغيير قيمة a‏ وهذا ما يعرف بالمرور بالمرجع. 


وإذا أردنا عمل نسخة مستقلة بحيث أن التعديل عليها لا يؤثر على الكائن الأساسي 
نستخدم التابع copyl)‏ كما في المثال الآتي: 


Alten, 
a <- student(name = "John", age = 21, avg = 75) 
b <- a$copy() 

bSname <- "Paul" 


a 
b 
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ail 
Reference class object of class "student" 
Field "name": 
[1] "John" 
Field "age": 
[1] 21 
Field "avg": 
[1] 75 


Reference class object of class "student" 
Field "name": 

[1] "Paul" 

Field "age": 

[1] 21 

Field "avg": 

[1] 75 | 


Baoe على‎ eno well المثال السابق أن‎ yo o 


الطرائق المرجعية: 
سبق وقلنا إن الطرائق في الأصناف المرجعية تنتمي إلى الصنف وليس إلى التوابع 
العامة. وإن جميع الأصناف المرجعية تمتلك طرائق معرفة تلقائياً تتم وراثتها من الصنف 








الرئيسي envRefClass‏ (سنشرح معنى “Ailjg”‏ في فقرة لاحقة). 


ومن الطرائق المعرفة تلقائياً نذكر .copy() .field(),show()...‏ وبإمكاننا بالطبع إضافة 
طرائقنا الخاصة وذلك عند تعريف الصنف بتمرير قائمة من التوابع للخاصية U methods‏ 
setRefClass()‏ كما في المثال الآتي: 


Jl 5 
| student <- setRefClass("student", 
fields = list(name = "character", age = "numeric", avg = "numeric"), 
methods = list( 
inc_age = function(x) { 
age <<- age + X 
} 
dec_age = function(x) { 
age <<- age - x 
} 
) 
0 
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في المثال السابق Lind‏ بتعريف طريقتين سميناهما inc_age()‏ و dec_age()‏ واللتان 
ستعدلان على الحقل age‏ 

لاحظ أننا استخدمنا الإسناد غير المحلي ->> وذلك لأن age‏ ليس lob‏ بالطريقة المعرفة 
فقط. cus‏ أن استخدام الإسناد المحلي -< سينشئ متحولاً lols Wao‏ بالطريقة اسمه 


age 


ولو Lind‏ بتنفيذ الكود السابق لكانت لدينا النتائج الآتية: 





ا 
s <- student(name = "John", age = 21, avg = 75)‏ 
sSinc_age(5)‏ 
sSage‏ 
sSdec_age(10)‏ 
sSage‏ 
al‏ 
26 
16 
مقارنة بين الأصناف الثلاثة: 
Reference Class $4 Class S3 Class‏ 
ليس لها doin‏ رسمية تعرف caja}‏ 
للتعريف باستخدام setClass()‏ باستخدام setRefClass()‏ 
تسكن ها اللكاسات | تنه اشتقاق کا نم اشتقاق الكاثنات 
بتعديل Gugino‏ باستخدام التعليمة()سء6ه ١‏ باستخدام التوابع المولدة 
الصنف الأساسي 
الوصول للمعطيات الوصول للمعطيات يكون الوصول للمعطيات يكون 
يكون باستخدام باستخدام المعامل © باستخدام المعامل $ 
المعامل $ 
الطرائق تنتمي إلى الطرائق تنتمي إلى olgil‏ الطرائق تنتمي إلى الصنف 
التوابع العامة العامة 
تمتاز طرائقها بخاصية | تمتاز طرائقها بخاصية | تمتاز طراثها بخاصية Joll‏ 
المرور بالقيمة المرور بالقيمة بالمرجع 
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الوراثة (Inheritance)‏ 
من أهم الخواص التي تمتاز بها البرمجة كائنية التوجه هي الوراثة. والتي تعني أننا 
نستطيع اشتقاق cain‏ جديد من cain‏ أساسي (Base Class)‏ وإضافة ميزات جديدة 
للصنف المشتق (Derived Class)‏ مع الاحتفاظ بميزات الصنف الأساسي دون الحاجة 

لإعادة كتابتها مرة أخرى. 


Feature | 
Base Class 


Feature 2 


Feature | 


Feat 2 
Derived Class eature 


New features 





أي أن الوراثة تشكل iwwi‏ هرمياً للأصناف Yio‏ شجرة العائلة بحيث يكون الصنف 
الأساسي في رأس الهرم والأصناف المشتقة تحته بالتسلسل. 


سنناقش الآن الوراثة في الأصناف الثلاثة التي تعرفنا عليها سابقاً وسنعتمد على الصنف 
student‏ الذي عرفناه سابقاً: 
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الوراثة من الصنف 53: 
كنا قد عرفنا الصنف student‏ بالشكل: 


s <- list(name = "bisher", age = 27, avg = 96) 





class(s) <- "student" 


function(n,a,g) { 
value <- list(name=n, age=a, avg=av) 
attr(value, "class") <- "student" 
value 


} 





ولنعرف الآن طريقة للتابع العام printQ‏ كما يلي: 


print.student <- function(obj) { 
cat(objSname, "\n") 


cat(objSage, "years old\n") 
cat("avg:", objSavg, "\n") 





سنقوم بتوريث الصنف السابق إلى cain‏ 29 نسميه InheritedStudent‏ ونشكل aio‏ 
WLS‏ وذلك وفق الشكل العام الآتي: 


class(obj)<-c(child,parent) 


EEE‏ ا ا 
ا ا ا 
parent‏ هو الصنف الأساسي الذي سنرث منه. 


التعليمة 
s <- list(name="John", age=21, avg=95, country="France")‏ 
""student") class(s) <- c("InheritedStudent‏ 
5 

all 

John 
21 years old 
avg: 95 
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ونلاحظ مما سبق أنه تم استدعاء الطريقة الموروثة print.student()‏ كوننا لم نعرف 
طريقة جديدة للتابع العام print)‏ ولنعرف الآن طريقة جديدة له owls‏ 
print.InheritedStudent()‏ بالشكل AUTI‏ 


print.InheritedStudent <- function(obj) { 
cat(objSname, "is from", objScountry, "\n") 


} 


5 


John is from France 
موروث باستخدام أحد التابعين المنطقيين‎ cain هو من‎ LSI! يمكننا معرفة فيما إذا كان‎ 
كما في الشكل الآتي:‎ isl) أو‎ inherits() 


inherits(s,"student") 
TRUE 
is(s,"student") 


TRUE 


سنعرف lain Jl‏ اسمه student‏ مع طريقة للتابع العام ‘show()‏ 
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الوراثة في الأصناف $4 تتم عند تعريف الصنف الموروث باستخدام التعبير contains‏ 


setClass("InheritedStudent", 
slots=list(country="character"), 


contains="student" 





) 
وبالتالي عند تعريف yas WIS‏ من الصنف الموروث سيكون لدينا: 





ا 
s <- new("InheritedStudent", name="John", age=21, avg=95, country="France")‏ 
show(s)‏ 
al‏ 
John‏ 
years old‏ 21 
avg: 95‏ 





ونلاحظ أن الطريقة المعرفة student cain‏ تم استدعاؤها عند تنفيذ التعليمة 
.show(s)‏ وكما سبق في الأصناف 53 نستطيع هنا Lay!‏ تعريف طرائق للأصناف الموروثة 
ليتم تنفيذها Jas‏ من الطرائق الموروثة من الصنف الأساسي. 


الوراثة من الأصناف المرجعية: 
الوراثة من الأصناف المرجعية تشبه كثيراً الوراثة من الأصناف 54 حيث ide‏ فقط إضافة 
التعليمة contains‏ في التصريح عن الصنف الموروث. 


:dec_age g inc_age ونعرف فيه طريقتين أسماؤها‎ student aowl lain ستعرف أولاً‎ 


student <- setRefClass("student", 
fields=list(name="character", age="numeric", avg="numeric"), 
methods=list( 
inc_age = function(x) { 
age <<- age + X 


} 
dec_age = function(x) { 
age <<- age - x 
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الآن سنقوم بتوريث الصنف السابق ونعدل على الطريقة inc_age‏ في الصنف الموروث 
ونضيف عليها اخباراً للتأكد من أن العمر الجديد ليس سالباً كما يلي: 


التعلامة 


InheritedStudent <- setRefClass("InheritedStudent", 
fields=list(country="character"), 
contains="student", 
methods=list( 

dec_age = function(x) { 
if((age - x)<0) stop("Age cannot be negative") 
age <<- age - x 
} 
) 
) 


s <- InheritedStudent (name="John", age=21, avg=95, country="France") 
sSdec_age(5) 

sSage 

sSdec_age(20) 

sSage 











[1] 16 
Error in sSdec_age(20) : Age cannot be negative 
| [4] 16 
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الفصل الخامس 
الرسم والمخططات 
(Graphs and Charts)‏ 


التابع ‘plot‏ 
هو من أكثر توابع الرسم استخداماً في R‏ وهو تابع (Generic function) ole‏ أي ail‏ 
يمتلك العديد yo‏ الطرائق حتى يلاثم الكاثنات الممررة له. 


أبسط استخدام للتابع plot‏ هو عندما نمرر له شعاعاً فيقوم برسم مخطط انتشار „aJ‏ 






التعليمة 
plot(c(3,2),c(1,4))‏ 
الناتج 






40 


3.6 


(1,4) 
2.0 


15 
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بإمكاننا استخدام التابع awy plotO‏ توابع رياضية أيضاً. فمثلاً awy‏ التابع sin(x)‏ نكتب: 





اه 
x<-seq(-pi,pi,0.1)‏ 
plot(x,sin(x))‏ 
ail‏ 
0ر 
Oo‏ 
o A‏ 
o‏ 
o o‏ 
o o‏ 
o o‏ 
o o‏ 
o o‏ 
o o‏ 
o o‏ 
o o‏ 
o‏ 
o‏ 
o‏ 
o‏ 
o‏ 
o‏ 
o‏ 9 
3 9 
£ 5 
ooo"‏ 
T T T T T T‏ 
3 2 1 0 1 2- 
x‏ 
بعض خصائص التابع ‘plot‏ 


sin(x) 
-0.5 0.0 05 10 


-1.0 








الجدول الآتي يبين أهم الخصائص التي يمكن استخدامها مع التابع ‘plot‏ 





main="text” 
xlab="text” 


ylab="text” 


type="tp" 


col="cl” 








لوضع ylgic‏ عام ow‏ مكان text‏ 
لوضع تسمية للمحور ×× مكان text‏ 
لوضع تسمية للمحور y`y‏ مكان text‏ 


te الرسم إلى‎ boi puòi 


Cl لون الرسم إلى‎ poi 


من الأنماط: م للنقاط؛ | 
اا 
من الألوان: 
blue,red,yellow....‏ 








59|Page 


























محمد بشر زينه 


وسنوضح هذه الخصائص بالمثال الآتي: 








اه 
x<-seq(-pi,pi,0.1)‏ 
plot(x,sin(x),col="blue",type="I",main="My Plot",xlab="xs",ylab="ys")‏ 
ail‏ 
My Plot‏ 
ف ا و ي d‏ هه 3 








(Overlaying Plots) عدة توابع في نفس النافذة‎ ow 

عند كل استدعاء للتابع plot‏ إن الرسم القديم ستتم إزالته ثم إدراج رسم جديد. Lol‏ إذا أردنا 
إدراج أكثر من رسمة في نفس النافذة فنستخدم التابع lines‏ أو التابع points‏ والمثال 
الآتي يقوم برسم: كل من تابع sin‏ وتابع cos‏ في نفس النافذة باستخدام التعليمة plot‏ 
أولاً owy‏ التابع sin‏ ثم التعليمة owy LU lines‏ التابع ‘cos‏ 





x<-seq(-pi,pi,0.1) 

plot(x, sin(x),main="Overlaying Graphs", ylab= 
lines(x,cos(x), col="red") 
legend("topleft",c("sin(x)","cos(x)"),fill=c("blue","red")) 


;type="I"_col="blue") 
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الناتج 


Overlaying Graphs 


o F 
= | @ sin(x) 
Wl cos(x) 














قمنا باستخدام التابع legend‏ والذي يمثل مفتاح الرسم البياني والذي تم وضعه في 
أعلى أيسر الرسم كوننا وضعنا الخاصية “topleft”‏ 


(Subplots) عدة مخططات متجاورة في نفس النافذة‎ ow) 
مخطط محدد في كل ساحة‎ owy عموداً ثم‎ n و‎ low m نقصد تقسيم ساحة العمل إلى‎ 
ولهذه العملية‎ mfrow وبالاستعانة بالخاصية‎ par) عمل جزثية. وهذا يتم باستخدام التابع‎ 
الشكل الآتي:‎ 

par(mfrow=c(m,n)) 


فلو أردنا ow)‏ التابعين sin‏ و cos‏ بجانب بعضهما البعض نكتب: 





x<-seq(-pi,pi,0.1) 
par(mfrow=c(1,2)) 
plot(x,sin(x),type="I") 
plot(x,cos(x),type="I") 
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o زر‎ o | 
wo _| «ا‎ 
Oo o 
zeal 2al 
as 2 id 
صا ص‎ 
o “| 9و‎ 
o | ا‎ 
٠ ما‎ ٠ ما‎ 
3 اوج 32 3 2 1 0 1- ت‎ OF Qs 
x x 





نسخ الرسوم (Copying Plots)‏ 
عند النقر على الزر export‏ تظهر W‏ الخيارات الآتية: 


| Export <| © 1 x 


E| Save as Image... 
TÌ Save as PDF... 


l eC Copy to Clipboard... 


الخيار copy to Clipboard‏ يقوم بنسخ ow)!‏ البياني وبإمكاننا بعد ذلك لصق الرسم أينما 
Up‏ 


الخيار Save as Image‏ يسمح Haas W‏ الرسم البياني على القرص الصلب أينما Up‏ 
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مخطط الانتشار (Scatter Plot)‏ 
يمكن ow)‏ مخطط الانتشار لشعاعين yg x‏ بالاستعانة بالتابع plot‏ الذي تكلمنا aic‏ سابقاً, 

فلو أردنا رسم مخطط الانتشار للبيانات الآتية: 
10 9 12 18 16 7 8 1 13 10[ 
7 8 10 13 15 9 10 12 15 1 
































X 
y 














نكتب مايلي: 
التعليمة 
x<-c(10,13,11,8,7,16,18,12,9,10)‏ 
y<-c(11,15,12,10,9,15,13,10,8,7)‏ 
plot(x,y)‏ 
الناتج 
لواش 








مخطط الأعمدة (Bar Plot)‏ 
يمكن aw)‏ مخطط الأعمدة لشعاع التكرارات أو النسب ‏ بالشكل: 





barplot(f,xlab=”xlab”,ylab=”ylab”,main=”Title”,names.arg=names) 
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cus‏ تستخدم الخاصية names.arg‏ لوضع تسمية توضيحية لما alinj‏ التكرارات f‏ على 
المحور ox‏ على شكل names clow‏ 


فإذا كان W‏ 31 أنثى و 46 53 وأردنا تمثيل هذه التكرارات بمخطط الأعمدة نكتب: 











een) 
barplot(c(31,46),names.arg=c("female","male"), 
main="gender",col=c("red","blue")) 
awl 
gender 
female male 









































ملاحظة: 


يمكننا قلب الأعمدة ورسمها بشكل أفقي باستخدام الخاصية .horiz=TRUE‏ 


ملاحظة: 
لو كانت WY‏ عدة بيانات وأردنا owy‏ مخطط الأعمدة لتكراراتها نحولها أولاً لجدول 
تكراري باستخدام التعليمة table‏ ثم نرسمها. 





age <- c(17,18,18,17,18,19,18,16,18,18) 
table(age) 
barplot(table(age)) 
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ail 
age 
16 17 18 19 
1261 








| 


16 17 18 19 








يمكننا ow‏ مخطط أعمدة مزدوجح (العمر حسب الجنس Cilio‏ وذلك بشرط yl‏ تكون بياناتنا 
على شكل جدول table‏ وسنوضح ذلك في المثال الآتي: 


Jlio 
data<- 
data.frame("gender"=c(rep("m",5),rep("f",5)),"age"=c(rep(20:21,2),rep(22:23,3))) 
dt<-table(data) 
dt 
ail 
age 
gender 20 21 22 23 
f 002 3 
m 2210 


قمنا بالتعليمة السابقة بتشكيل جدول يمثل jloci‏ افتراضية لذكور وإناث. وسنقوم الآن 
برسم مخطط الأعمدة الموافق له بالشكل الآتي: 
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ا 
barplot(dt,beside=TRUE,col=c("red","blue"))‏ 
legend("topleft",c("female","male"),fill=c("red","blue"))‏ 


الناتج 





30 


@ female 
@ male 


in | 
لك‎ 
2 | 
oO 
o ل‎ 
21 22 23 


مخطط الفطيرة (Pie Chart)‏ 
يمكن رسم مخطط الفطيرة لشعاع التكرارات أو النسب ۴ بالشكل: 
| 


labels Jiaj‏ أسماء ووصف التكرارات ۴. ولرسم نفس المثال السابق بمخطط الفطيرة نكتب: 








25 


2.0 




















pie(f ,main="Title” labels=names) 








pie(c(31,46),labels=c("female","male"),main="gender") 
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الناتج 


gender 


female 








مخطط الصندوق (Box Plot)‏ 
يمكن استخدام مخطط الصندوق لتمثيل GUL! clow‏ الكمية x‏ وذلك بالشكل: 


boxplot(x,ylab=”ylab”,main=” Title”) | 





age <- c(10,7,18,10,12,19,18,20,3,14,19,55,25,31,26,11,34) 
boxplot(age,main="Ages") 
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الناتج 


Ages 


50 


40 











للمخطط السابق فائدة وصفية كبيرة. حيث تمثل dab‏ الصندوق Wall‏ الربيع الأول. وتمثل 
حافة الصندوق العليا الربيع ¿Jil‏ بينما häll Jio‏ الذي هو داخل الصندوق الربيع الثاني. 
وبالتالي يحوي الصندوق %50 من البيانات. كما أن الدواثر التي قد نراها خارج الصندوق تمثل 
القيم الشاذة. 


ملاحظة: 
يمكن رسم أكثر من مخطط في نفس النافذة og)‏ الأشعة المراد رسمها بجانب بعضها 


البعض مفصولا بينها بفواصل, Iio‏ 
boxplot(agel,age2)‏ 























R البرمجة الإحصائية‎ ao) 


المدرج التكراري (Histogram)‏ 

يستخدم مع البيانات الكمية owy‏ الشعاع x‏ بالشكل: 

olal النقاط التي نريد استخدامها لتجزئة البيانات. وهو أيضاً يمثل عدد‎ sac breaks Jiaj 
البيانات لها ناقصاً واحد. وبالتالي هو يمثل عدد الأعمدة التي ستظهر‎ auði التي نريد أن‎ 
ناقصاً واحد.‎ 


age <- c(10,7,18,10,12,19,18,20,3,14,19,55,25,31,26,11,34( 
hist(age,breaks=3) 


Histogram of age 


Frequency 
6 
1 
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الفصل السادس 
نظرية الاحتمالات 
(Probability Theory)‏ 


قبل أن تبدأ بهذا الفصل ede‏ أولاً أن تقوم بتحميل حزمة الاحتمالات prob‏ من موقع 
CRAN‏ أو باستخدام التعليمة الآتية: 


1 Înstall.packages(“prob”) S 


library(“prob”) 


نمذجة فضاء dio)!‏ لبعض التجارب الاحتمالية (Sample Spaces)‏ 

أحد أهم التجارب الاحتمالية التي قد aigi‏ بها هي تجربة رمي قطعة نقود متزنة n‏ مرة, 
وحتى نستخلص النتائج المرجوة من هذه التجربة علينا أولاً معرفة فضاء الحالة. وهذا ما 
يقدمه لنا 8 وبسهولة مطلقة باستخدام التعليمة: 


فمثلاً عند رمي قطعة نقود متزنة 3 مرات إن فضاء الحالة سيكون: 





tosscoin(3) 
10551 toss2  toss3 
1 H H H 
2 T H H 
3 H T H 
4 T T H 
5 H H T 
6 T H T 
7 H T T 
8 T T T 








الجدول السابق يبين أنه عند رمي قطعة النقود 3 Glo‏ فإن aac‏ الحالات التي قد نصادفها 
هو 8 ab‏ كل حالة من هذه الحالات ممثلة بسطر مستقل. 





R البرمجة الإحصائية‎ Ga) 


تجربة أخرى تصادفنا كثيراً في كتب نظرية الاحتمالات ألا وهي تجربة رمي حجر نرد متزن 
n‏ مرة. وأيضاً RW ai‏ إيجاد فضاء الحالة لهذه التجربة باستخدام التعليمة: 


ومن التجارب التي نصادفها أيضاً هي تجربة سحب k‏ كرة من صندوق أو sleg‏ كبير (Urn)‏ 
فيه كرات مرقمة من ١‏ إلى n‏ والتي يمكن أيضاً نمذجتها باستخدام 8 بالشكل الآتي: 


urnsamples(1:n,size=k,replace=TRUE or FALSE,ordered = TRUE or FALSE) 
size=k الوسيط الثاني‎ Lol .n ترقيم الكرات والتي عددها‎ Tn حيث يمثل الوسيط الأول‎ 
حالة‎ replace = TRUE or false فيمثل عدد الكرات المراد سحبها. ويمثل الوسيط الثالث‎ 
ordered=TRUE or الوسيط الأخير‎ Lol أو بدون إعادة,‎ (TRUE) السحب هل هي مع إعادة‎ 
(FALSE) أو غير مهم‎ (TRUE) logo فيمثل كون الترتيب‎ FALSE 





فلو أردنا سحب كرتين من ثلاث كرات على الترتيب وبدون إعادة يكون: 


مثال 


urnsamples(1:3,size = 2,replace = FALSE, ordered = TRUE) 
al 
X1 X2 





جم م بنط ي 








حرم یم یم یں WN‏ 
N‏ د ين د ين نم 


6 
وآخر تجربة دا شهيرة نصادفها في Juo‏ الاحتمالات هي تجربة أوراق Jio Jo coll‏ فضاء 
العينة لأوراق اللعب بالتعليمة الآتية: 


ع ع 53 |71 
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(Events) الأحداث‎ 


Wuj‏ نستطيع تعريف الحدث على أنه مجموعة جزثية من فضاء العينة. فلو كانت لدينا التجربة: 


probs 
0.25 
0.25 
0.25 
0.25 





S<-tosscoin(2,makespace=TRUE) 

S 

الناتج 

toss2 
H 
H 
T 
T 


toss1 
H 
T 
H 
T 


خم م AU‏ 





فيمكننا أخذ الحدث 8 الممثل بأول ثلاثة سطور بالشكل: 





5]1:3,[ 





الناتج 
toss1 toss2 probs‏ 
H H 0.25‏ 1 
T H 0.25‏ 2 
H T 0.25‏ 3 








أو أخذ السطر الثاني والرابع iio‏ بالشكل: 







ظ 






S[c(2,4,] 








al 
toss1 toss2 probs 
2 T H 0.25 
4 T T 0.25 


ملاحظة: 
الخاصية makespace=TRUE‏ تجعل R‏ يقوم بحساب الاحتمالات لفضاء العينة المولد. 


ملاحظة: 


بامكاننا تعريف الفضاء الاحتمالي واحتمالاته كما نشاء. والمثال الآتي يعرف احتمالات 
رمي قطعة نقود غير متجانسة مرة واحدة: 


probspace(tosscoin(1),probs=c(0.3,0.7)) 














لفة البرمجة الإحصائية 8 


بإمكاننا أيضاً اختيار الأسطر التي تمثل شرطاً محدداً باستخدام التابع subset‏ فمثلاً إن الحدث 
الذي يمثل أوراق لعب الكوبة يمكن تمثيله بالشكل: 











S<-cards() 
subset(S,suit=="Heart") 
rank suit 
27 2 Heart 
28 3 Heart 
29 4 Heart 
30 5 Heart 
31 6 Heart 
32 7 Heart 
33 8 Heart 
34 9 Heart 
35 10 Heart 
36 J Heart 
37 Q Heart 
38 K Heart 
39 A Heart 
أما أوراق اللعب التي تحمل أرقاماً بين 7 و 9 فيمكن تمثيلها بالشكل:‎ 
Jlio 
S<-cards() 


subset(S,rank %in% 7:9) 









rank suit 
6 7 Club 
7 8 Club 
8 9 Club 
19 7 Diamond 
20 8 Diamond 
21 9 Diamond 
32 7 Heart 
33 8 Heart 
34 9 Heart 
45 7 Spade 
46 8 Spade 
47 9 Spade 
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في تجربة إلقاء حجر نرد ثلاث مرات, إن حدث كون مجموع الوجوه الثلاثة أكبر من 16 يمثل 
بالشكل الآتي: 


subset(rolldie(3), X1 + X2 + X3 > 16) 











ail 
X1 X2 X3 
180 6 6 د‎ 
210 6 5 6 
215 5 6 6 
216 6 6 6 
‘isin التابع 7107 والتابع‎ 
x Jo! clow تقع في‎ y يستخدم التابع #157 لمعرفة فيما إذا كانت كل قيمة من الشعاع‎ 
مثال‎ 
x<-1:10 
y<-8:12 
y %in% x 


الناتح 
TRUE TRUE TRUE FALSE FALSE‏ 
ذلك لأن كل من 8 و 9 و 10 تقع في الشعاع NYS) x‏ و 12 لا تقعان فيه. 








يستخدم التابع isin‏ لمعرفة إذا كان الشعاع y‏ بأكمله يقع في x JAT elai‏ 


مثال 
x<-1:10‏ 
y<-8:12‏ 
isin(y,x)‏ 
ail‏ 
FALSE‏ 
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(Union, Intersection and Difference) الاجتماع والتقاطع والفرق‎ 

















union(A,B) في ۸ أو 8 أو كلاهما‎ AUB الاجتماع‎ 
intersect(A,B) loo B gAcno ANB التقاطع‎ 
setdiff(A,B) B في ۸ ولیس في‎ A\B الفرق‎ 


بإمكاننا الاستفادة من التعليمات السابقة للتعامل مع الأحداث. فمثلاً لو أردنا تعريف 
الحدث الذي يقع إذا كان مجموع الرقمين الظاهرين على حجري نرد أكبر من 8 وكان 
الوجهان فرديين نكتب ما يلي: 


Jlio 
A<-subset(rolldie(2),X1+X2>8) 
B<-subset(rolldie(2),X1 %% 2 == 0 && X2 && 2 == 0) 
intersect(A,B) 

ail 

X1 X2 

24 6 4 
34 4 6 
36 6 6 








مسألة: 
في تجربة إلقاء حجري نرد leo‏ احسب احتمال الحصول على وجهين مجموعهما يقبل 


القسمة على 3. 


الحل 
A<-subset(rolldie(2,makespace=TRUE),(X1+X2) %% 3 == 0)‏ 
Prob(A)‏ 


الناتج 
0.3333333 
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الاحتمالات الشرطية (Conditional Probabilities)‏ 
ulw iisa‏ الاحتمال الشرطي PCAIB)‏ في R‏ باستخدام التعليمة: 


Prob(A,given=B) 
نكتب:‎ G95 أنها‎ lale 5 أردنا حساب احتمال كون الورقة المسحوبة تحمل العدد‎ gla 


A<-subset(cards(makespace=TRUE),suit=="Heart") 
B<-subset(cards(makespace=TRUE),rank == 5) 
Prob(B,given=A) 


الناتج 
0.07692308 








مسألة: صندوق يحتوي سبع كرات حمراوات وثلاث كرات خضراوات. lind‏ بسحب ثلاث كرات 
على التتالي بدون dale!‏ والمطلوب: احسب احتمال أن تكون جميع الكرات المسحوبة 
حمراوات. 


L <- rep(c("red", "green"), times = c(7, 3)) 

M <- urnsamples(L, size = 3, replace = FALSE, ordered = TRUE) 
N <- probspace(M) 
Prob(N, isrep(N, "red", 3)) 






ail 


0.2916667 








ما احتمال الحصول على 645 حمراء ثم 645 خضراء ثم 645 حمراء؟ 





0.175 


lo‏ احتمال الحصول على كرتين حمراوين وكرة خضراء؟ 

















R البرمجة الإحصائية‎ ao) 


(Binomial Distribution) B (n, p) التوزيع الثنائي‎ 
تعطى دالة الاحتمال للتوزيع الثنائي بالعلاقة:‎ 
RQK = l) كت‎ CE DE a" pik = O, t 


2 
2 
£ 
7 


dbinom(k,n,p) 
بالشكل:‎ R فنعرفها في‎ F(k) = P(X < k) دالة التوزيع المتجمعة‎ Lol 


pbinom(k,n,p) 
باستخدام التعليمة:‎ F(a) = prob والذي يحقق‎ a 330)! بإمكاننا إيجاد‎ 


qbinom(prob,n,p) 
باستخدام‎ B(n, p) تخضع للتوزيع الثنائي‎ N عشوائية حجمها‎ Gite كما بإمكاننا توليد‎ 
ا‎ 


توزيع بواسون (Poisson Distribution) poi(A)‏ 
تعطى دالة الاحتمال لتوزيع بواسون بالعلاقة: 


AK 
PECTOS T sik = Oil, 


poig‏ عن ذلك الاحتمال في 8 بالشكل: 


dpois(k,lambda) 
بالشكل:‎ R فنعرفها في‎ F(k) = P(X > k) دالة التوزيع المتجمعة‎ Lol 


ppois(k,lambda) 
باستخدام التعليمة:‎ F(a) = prob والذي يحقق‎ a 330)! بإمكاننا إيجاد‎ 


qpois(prob,lambda) 


P 
1 
£ 
i 
1 
z 
= 
: 
E: 
EB 


rpois(N,lambda) 
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التوزيع المنتظم (Uniform Distribution) U(a,b)‏ 
تعطى دالة الكثافة الاحتمالية للتوزيع المنتظم بالعلاقة: 


1 
ا ار 


ونعبر عنها في 8 بالشكل: 


dunif(x,a,b) 
بالشكل:‎ R فنعرفها في‎ F(k) = P(X > k) دالة التوزيع المتجمعة‎ Lol 


punif(x,a,b) 
باستخدام التعليمة:‎ F(a) = prob والذي يحقق‎ a بإمكاننا إيجاد العدد‎ 

qunif(x,a,b) 
ol so با‎ U(a,b) 2 mne JI لماع . للتوزيع‎ N l ; ائية‎ h 57 5 كما بإمكاننا توليد‎ 
اا‎ 


التوزيع الأسي (Exponential Distribution) exp(A)‏ 
تعطى دالة الكثافة الاحتمالية للتوزيع الأسي بالعلاقة: 


fG)=Je = عر‎ < 0 


ونعبر عنها في 8 بالشكل: 


CIMA Elune ED] 
بالشكل:‎ R فنعرفها في‎ F(k) = P(X > k) دالة التوزيع المتجمعة‎ Lol 


pexp(x,lambda) 
باستخدام التعليمة:‎ F(a) = prob والذي يحقق‎ a بإمكاننا إيجاد العدد‎ 


qexp(prob,lambda) 
i 


3 
2 
i 
1 
£ 
F 
: 
E: 
e B 


rexp(N,lambda) 
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التوزيع الطبيعي (Normal Distribution) N (pu, o°)‏ 
تعطى دالة الكثافة الاحتمالية للتوزيع الطبيعي بالعلاقة: 


1 1/12 
اع‎ 
ON2T 





f(x) = 


ونعبر عنها في 8 بالشكل: 


dnorm(x,mu,sigma) 
بالشكل:‎ R فنعرفها في‎ F(k) = P(X > k) دالة التوزيع المتجمعة‎ Lol 


pnorm(x,mu,sigma) 
باستخدام التعليمة:‎ F(a) = prob 945) والذي‎ a بإمكاننا إيجاد العدد‎ 


بإمكاننا wg‏ عينة عشوائية حجمها N‏ تخضع للتوزيع الطبيعي )?0 N(u,‏ باستخدام 
ا 


توزيع كاي -مربع (Chi-Square Distribution) y? (n)‏ 
تعطى دالة الكثافة الاحتمالية لتوزيع كاي-مربع بالعلاقة: 
1 


f(x) “2x2 0 
ق = رین‎ 2X2 3X > 
22r (5) 


ونعبر عنها في 8 بالشكل: 


أما دالة التوزيع المتجمعة F(k) = P(X > k)‏ فنعرفها في R‏ بالشكل: 


بإمكاننا إيجاد العدد a‏ والذي يحقق F(a) = prob‏ باستخدام التعليمة: 


qchisq(prob,n) 
2 


X 
P 
J 
- 
f 
g 
F 
= 
£ 
2 
E: 
3 
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توزيع ستيودينت (Student Distribution). t(n)‏ 
تعطى دالة الكثافة الاحتمالية لتوزيع ستيودينت بالعلاقة: 








C 
عنها في 8 بالشكل:‎ poig 


Lol‏ دالة التوزيع المتجمعة F(k) = P(X > k)‏ فنعرفها في R‏ بالشكل: 


بإمكاننا إيجاد العدد a‏ والذي يحقق F(a) = prob‏ باستخدام التعليمة: 


Ta ul il ol so با‎ t(n) للتوزيع‎ . an N | aul h 05 5 بإمكاننا توليد‎ 


توزيع فيشر (Fisher Distribution) F(m,n)‏ 
تعطى ölə‏ الكثافة الاحتمالية لتوزيع فيشر بالعلاقة: 





يج 
(a‏ 
R‏ 
A‏ 
Il‏ 
aN‏ 
مراع N|‏ 
سل 
Coa‏ 
313 
ر 
8 إده 
R‏ 
| 
en‏ 
oS‏ 
m.‏ 
+ 
xR‏ 
| 
A‏ 
R‏ 
4 
S‏ 


NI ع‎ 


Lol‏ دالة التوزيع المتجمعة F(k) = P(X < k)‏ فنعرفها في R‏ بالشكل: 


بإمكاننا إيجاد العدد a‏ والذي يحقق F(a) = prob‏ باستخدام التعليمة: 


qf(prob,m,n) 


L 


3 
2 
i 
1 
= 
F 
3 
: 
E 
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حساب التوقع الرياضي والتباين والانحراف المعياري لمتحول عشوائي 
(Expectation, Variance and Standard Deviation)‏ 


بإمكاننا حساب التوقع الرياضي Qİ‏ تابع )و للمتحول العشوائي X‏ باستخدام التعليمة: 


لكن أولاً علينا تحميل الحزمة distrEx‏ بالشكل: 


install.packages(“distrEx”) 
نكتب:‎ N(2,1) للتوزيع الطبيعي‎ E(2X+1) فمثلاً إذا أردنا حساب‎ 


TE 
X<-Norm(2,1) 


E(2*X+1) 
ai 





كما يمكننا حساب WLU!‏ والانحراف المعياري باستخدام كل من التعليمتين: 


var(expression in X) 
sd(expression in X) 
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الفصل السابع 
اختبارات الطبيعية واختبارات تجانس التباينات 


(Normality Tests and Homogeneity of Variances Tests) 


(Hypothesis Testing) اختبار الفرضيات‎ 


نستطيع تعريف الفرضية على أنها تخمين أو ادعاء يتعلق بوسطاء المجتمع الإحصائي 
وهي تحتمل الصحة والخطأ. 

عندما رغب الباحث باختبار أي فرضية عليه أن يصوغها على شكل فرضيتين. فرضية تدعى 
فرضية (Null Hypothesis) paol‏ ويرمز لها بالرمز Ho‏ وفرضية تدعى الفرضية البديلة 
(Alternative Hypothesis)‏ ويرمز لها بالرمز .H,‏ وهدف اختبار الفرضية هو دراسة إمكانية 
رفض الفرضية الابتدائية عند مستوى أهمية محدد. فبعد صياغة الفرضيتين الابتدائية 
والبديلة وتحديد مستوى الأهمية وعادة يكون 0.05 أو 0.01 أو 0.1. يقوم الباحث بإيجاد 
إحصاء الاختبار المناسب وحساب معنوية الاختبار .(P-Value) (Significance)‏ ثم تأتي مرحلة 
اتخاذ القرار الإحصائي بمقارنة معنوية الاختبار go‏ مستوى الأهمية. فإذا كانت قيمة 
Jal P-Value‏ من مستوى الأهمية نرفض الفرضية الابتدائية, وإذا كانت قيمة HSI P-Value‏ 
من مستوى الأهمية لا نستطيع رفض الفرضية الابتداثية. 


بعض اختبارات الطبيعية (Some Normality Tests)‏ 
توجد العديد من الاختبارات التي يمكن بواسطتها التأكد من التزام البيانات بالتوزيع 
الطبيعي وسنحاول عرض أهمها: 
اختبار ‘Kolmogorov-Smirnov‏ 
يستخدم لاختبار الفرضية: 
Ho: X~N(u, 07)‏ 
مقابل: 


H,:XZN(u,02) 


R البرمجة الإحصائية‎ ao) 


ويمكن تطبيقه باستخدام R‏ بالشكل: 


ks.test(X,” pnorm”,mu,sigma) | 


فإذا كانت P>0.05‏ فإن cja GUL!‏ وفق التوزيع الطبيعي. 


مثال 





x<-rnorm(300) 
_ks.test(x,"pnorm") 
ail 


One-sample Kolmogorov-Smirnov test 





data: x 
D = 0.044407, p-value = 0.595 
alternative hypothesis: two-sided 








Lag‏ أن P>0.05‏ فإن بياناتنا تخضع للتوزيع الطبيعي. 
اختبار ‘Shapiro-Wilk‏ 
ويستخدم لاختبار الفرضية: 


Hy: X~N(u, 0?) 


3 


Hy: X¢N(u, 02)‏ 
ويمكن تطبيقه باستخدام 8 بالشكل: 
فإذا كانت P>0.05‏ فإن البيانات تتوزع وفق التوزيع الطبيعي. 
مخطط Plot) Q-Q‏ 0-0): 


وهو طريقة وصفية Jal‏ دقة من الطريقتين السابقتين, من الممكن الاستئناس بها للتأكد 
من طبيعية البيانات. وتعتمد هذه الطريقة على رسم مخطط انتشار للبيانات بعد ترتيبها 
تصاعدياً مع قيمها المعيارية. فإذا كان للانتشار شكل خطي حول مستقيم الطبيعية تكون 
البيانات طبيعية. وكلما ابتعدت البيانات عن مستقيم الطبيعية دلنا هذا على عدم التزام 
البيانات بالتوزيع الطبيعي. 


يتم رسم مخطط هه في 8 بالشكل: 
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ا 


qqnorm(x) 
qqline(x) 
الناتج‎ 


Normal Q-Q Plot Normal Q-Q Plot 


1 


Sample Quantiles 
1.0 
Sy 1 
Sample Quantiles 
0 
1 


1 
-1 


0.5 
1 

















Theoretical Quantiles Theoretical Quantiles 


مخطط QQ‏ يدل على أن العينة لدينا تتوزعم ٠‏ مخطط ه۵۵ يدل على أن العينة لدينا لا تتوزع 
وفق التوزيع الطبيعي وفق التوزيع الطبيعي 











المدرج التكراري (Histogram)‏ 
سبق الكلام aic‏ في الفصل الخامس. وهو طريقة Jal‏ جودة من أول طريقتين. ning‏ 
تلتزم البيانات بالتوزيع الطبيعي يجب أن يكون لهذا المخطط شكلاً يشابه الشكل الآتي: 





Histogram of z 


Frequency 
5 













































































































































































R البرمجة الإحصائية‎ ao) 


(Homogeneity of Variance) اختبارات تجانس التباينات‎ 

توجد العديد من اختبارات تجانس التباينات وأشهرها اختبار بارتليت Bartlett‏ واختبار ليفين 
‘Levene‏ 

(Bartlett's Test) اختبار بارتليت‎ 


يستخدم عندما تكون GUL!‏ تتوزع Gag‏ التوزيع الطبيعي ومقسمة )629 مجموعات 
حسب عامل محدد ونريد اختبار الفرضية: 


RE ا‎ = 
Ho: oj = 2 = ووو‎ = Or 
مقابل:‎ 
EE 2 Bours, 
111:07 + of for some i, j 


فإذا كانت لدينا myData lgowl Data frame‏ فيها المتفير المدروس Y‏ والعامل × يمكن 
تطبيق الاختبار السابق باستخدام 8 بالشكل: 


bartlett.test(Y ~ X, data=myData) 


فإذا كانت P>0.05‏ فإن البيانات متجانسة. 
مثال: ولد 200 قيمة عشوائياً وقسمها إلى مجموعتين b g a‏ وطبق اختبار بارتليت للتجانس. 


Jlo 





y<-rnorm(200) 

x<-c(rep(1,100),rep(2,100)) 
x<-factor(x,levels=c(1,2),labels=c("a","b")) 
myData<-data.frame(y,x) 
bartlett.test(y~x,myData) 






ail 
Bartlett test of homogeneity of variances 


data: y by x 
Bartlett's K-squared = 0.10146, df = 1, p-value = 0.7501 








التفسير: 


نلاحظ أن 0.05<م وبالتالي إن البيانات 8 والبيانات 8 متجانسة. 


© ع 23 | 85 





اختبار ليفين (Levene’s Test)‏ 
يجب تحميل الحزمة car‏ قبل تطبيق اختبار ليفين والذي يستخدم عندما تكون البيانات لا 
تتوزع وفق التوزيع الطبيعي ومقسمة لعدة مجموعات حسب عامل محدد ونريد اختبار 

الفرضية: 


2 ہے سبيت 0 
وا = 900 02 = Ho: of‏ 


مقابل: 
H,:07 # of for some i,j‏ 


فإذا كانت لدينا myData lgowl Data frame‏ فيها المتفير المدروس Y‏ والعامل X‏ يمكن 
تطبيق الاختبار السابق باستخدام 8 بالشكل: 


library(car) 
leveneTest (Y ~ X, data=myData) 


فإذا كانت P>0.05‏ فإن البيانات متجانسة. 
مثال: ولد 200 قيمة عشوائياً وقسمها إلى مجموعتين a‏ و b‏ وطبق اختبار ليفين للتجانس. 


مثال 
y<-rnorm(200)‏ 
x<-c(rep(1,100),rep(2,100))‏ 
x<-factor(x,levels=c(1,2),labels=c("a","b"))‏ 
myData<-data.frame(y,x)‏ 
leveneTest(y~x,myData)‏ 
ail‏ 
Levene's Test for Homogeneity of Variance (center = median)‏ 
Df Fvalue Pr(>F)‏ 
group 1 0.1099 0.7406‏ 
198 








التفسير: 
نلاحظ أن 5 وبالتالي إن البيانات 8 والبيانات 8 متجانسة. 





لفة البرمجة الإحصائية R‏ 


الفصل الثامن 
(Scales of Measurement)‏ 


بعد جمع الباحث للبيانات التي سيجري عليها التحليل الإحصائي واختبار الفرضيات يجب 
عليه معرفة نوع البيانات المستخدمة. حيث أنه لكل نوع من البيانات اختباراته الخاصة 
وعدم معرفة الباحث بذلك يجعله يقع في أخطاء جسيمة في بحثه وبالتالي تكون نتائج 


يمكن تصنيف البيانات إلى نوعين رئيسيين هما البيانات النوعية Qualitative Data‏ 
والبيانات الكمية Quantitative Data‏ 


(Qualitative Data) البيانات النوعية‎ 

وتنقسم إلى نوعين هما البيانات الاسمية Nominal Data‏ والبيانات الرتبية Ordinal Data‏ 
Lol‏ البيانات الاسمية فهي تكون في صورة غير عددية. أي لا يمكن قياسها. وتتكون من 
Glia‏ متشابهة تحمل نفس الخصائص لا يتم التفاضل بينها Jio‏ الجنس الذي يتكون من 
فئتين. الذكور ونرمز لهم بالرقم )1( والإناث ونرمز لهن بالرقم (2). أو Ilio‏ السؤال الذي 
تكون إجابته “نعم “ ونرمز له بالرقم (1) و“ لا“ ونرمز له بالرقم (0). في هذا egil‏ من 
البيانات لا نقوم سوى بحساب التكرارات والتمثيل البياني فقط. والخطأ الذي يقع فيه 
الباحث هو إجراء عمليات حسابية على البيانات الاسمية. 


أما البيانات الترتيبية فهي أيضا تكون في صورة غير عددية ولا يمكن إجراء العمليات 
الحسابية عليها والفرق بينها وبين البيانات الاسمية هي عملية المفاضلة والترتيب بين 
طبقات المتغير Jio‏ المستوى التعليمي (ابتدائي (1). إعدادي (2). ثانوي (3). جامعي 
فأكثر (4)) وفي هذه الحالة قد نستطيع تفسير المتوسط الحسابي أو الوسيط وبعض 
المقاييس الأخرى,. إلا أن أي عملية حسابية على تلك البيانات ليس لها معنى. 
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البيانات الرقمية أو الكمية Quantitative Dat)‏ ): 

تنقسم أيضا إلى نوعين هما البيانات الفتروية Interval Data‏ والبيانات النسبية 
Lol , Rational Data‏ البيانات الفتروية فتكون في صورة عددية ويمكن إجراء العمليات 
الحسابية عليها مثل المتوسط الحسابي والانحراف المعياري وغيرها ويمتاز هذا المقياس 
بتساوي المسافات بين الرتب حيث أنه يسمي أحيانا ” بمقياس المسافة ”. ويستخدم هذا 
المقياس كثيراً في العلوم التربوية والنفسية والاجتماعية Jio‏ قياس الذكاء وغيرها , 
والجدير بالذكر أن هذا المقياس لا يعني الصفر فيه عدم وجود الخاصية فدرجة طالب 
تساوي yan‏ مثلا لا يعني أنه لا يعرف شيئاً في المقرر. كما أن درجة الحرارة صفر لا تعني 
انعدام ظاهرة الحرارة. 

وأخيراً البيانات النسبية وهي أعلى مستوى من أنواع البيانات السابقة حيث يمتاز 
المستوى النسبي بكافة صفات المستويات السابقة بالإضافة لخاصية النسبية والتي 
تعني إن للصفر خاصية paol‏ أي خاصية انعدام الظاهرة, Jio‏ سرعة السيارة التي تساوي 
صفر تعني أن السيارة متوقفة . أو أن وزن شخص يساوي 60 كيلو جرام هو ضعف وزن 
شخص وزنه 30 كيلو جرام. 

وبهذا نلخص هذا الفص حسب النظرية التي قام بتطويرها عالم علم النفس ستائلي 
سميث ستيفنس (Stanley Smith Stevens)‏ و هي نظرية أنواع الفياس 1946. حيث قال 
ستيفنس yl‏ القياس في العلوم يأخذ أحد الأشكال الآتية: 


Nominal الاسمي‎ R 
Ordinal nul R 
Interval الفتروي‎ © 
Ratio النسبي‎ @ 


R البرمجة الإحصائية‎ ao) 


الفصل التاسع 
مقارنة المجموعات 
(Comparing Groups)‏ 


اختبار ستيودينت للعينة الواحدة ‘(One Sample t-test)‏ 
يستخدم اختبار ستيودينت للعينة الواحدة لاختبار الفرضية: 
Ho: X =m‏ 
مقابل: 
Ay:x#m‏ 
أي لاختبار اختلاف متوسط العينة ‏ عن قيمة lo‏ مثل .m‏ ومن تطبيقاته في الحياة 
العملية اختبار القيمة m‏ فيما إذا كانت شاذة أو J‏ 
للتطبيق باستخدام 8 نكتب التعليمة: 





شروط تطبيق اختبارغ لعينة واحدة 


أن يكون متغير الدراسة 05 
أن تتوزع البيانات وفق التوزيع الطبيعي. 
عدم وجود قيمة شاذة. 


أن يكون حجم العينة يشكل %5 على الأقل من حجم المجتمع. 








KR تت‎ fw LL 


لتكن لدينا فياسات سكر الدم لمجموعة yo‏ المرضى الذين تم علاجهم باستخدام الدواءين 
.Lantus+R‏ والمطلوب معرفة فيما إذا كان سكر الدم للعينة منضبطاً. lale‏ أن متوسط 
سكر odl‏ الطبيعي لمرضى السكر يعتبر NO‏ 


Tew 140 90 110 125 111 128 113 89 110 
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الحل 
x<-c(110,89,113,128,111,125,110,90,140)‏ 
t.test(x,mu=110)‏ 





ail 
One Sample t-test 


data: x 

t = 0.5197, df = 8, p-value = 0.6174 .1 

alternative hypothesis: true mean is not equal to 110 .2 
95 percent confidence interval: .3 

125.7077 100.0701 .4 

sample estimates: .5 

mean ofx .6 


112.88895 .7 








التفسير: 


في السطر الأول يعرض 8 إحصائية الاختبار t‏ وعدد درجات Gyo)!‏ و p-value‏ (المعنوية) وقد 
كانت قيمة المعنوية p-value=0.6174‏ والتي هي أكبر من 0.05 وبالتالي لا نستطيع أن 
نرفض الفرضية الابتدائية التي تقول بعدم وجود اختلاف معنوي لسكر الدم عند المرضى 
عن سكر pall‏ الطبيعي وذلك عند مستوى المعنوية %5 السطر الثاني يخبرنا بأن الفرضية 
البديلة تنص على أن متوسط سكر الدم للمجموعة يختلف عن 110 ويقصد بالسطر الثالث 
أنه سيتم إظهار %95 فترة ثقة لمتوسط سكر الدم للمرضى,. وبالسطر الرابع تم عرض فترة 
الثقة والتي كانت 125.711 ,100.07] والتي تعني ail‏ وبثقة %95 في المجتمع الأصلي الذي 
سحبنا aio‏ عينتنا سيكون متوسط سكر pl‏ بين 100.07 و 125.71 Lol‏ السطر الخامس 
فمعناه: Gado‏ العينة, والسطر السادس يعني متوسط x‏ والذي تم إظهاره في السطر 
السابع. ويمكن تقدير متوسط المجتمع الذي سحبت aio‏ العينة x‏ ب 112.89. 


Independent Samples t-) اختبار ستيودينت للعينتين المستقلتين‎ ‘Lili 
(test 
يستخدم اختبار ستيودينت للعينتين المستقلتين لاختبار الفرضية:‎ 
زح نولا‎ 
مقابل:‎ 





R البرمجة الإحصائية‎ ao) 


أي لاختبار اختلاف متوسط العينة ‏ عن متوسط العينة تز. أي لمعرفة إذا كان الفرق بين 
تز,: هو فرق ذو أهمية إحصائية أو أنه فقط بمجرد الصدفة. 
هناك حالة أعم لاختبار ستيودينت للعينتين المستقلتين وتصاغ فرضيتاه بالشكل: 
Ho: x-y =m‏ 
مقابل: 
Hy:x-—y#m‏ 
والذي يدرس معنوية كون الفرق بين ,× يساوي مقدار m Jio cu‏ 
للتطبيق باستخدام 8 نكتب التعليمة: 


t.test(x,y,mu=m) | 


ويمكن إهمال الوسيط الثالث في حال كان m=0‏ 





RE gatizol DÎ SÊ boy 
أن يكون متغير الدراسة كمياً.‎ 

أن تتوزع البيانات لكل من العينتين وفق التوزيع الطبيعي. 
أن تكون العينتان مستقلتين. 

عدم وجود قيمة شاذة. 


أن يكون حجم العينة يشكل %5 على الأقل من حجم المجتمع. 





on لح‎ wo wp ند‎ 





لتكن لدينا فياسات سكر الدم لمجموعتين من المرضى حيث تأخذ المجموعة الأولى الدواء 
Lantus‏ وتأخذ المجموعة الثانية الدواءين -Lantus+R‏ 







m 158 19 m 1 18 164 149 140 
140 #90 no 2 m 338 1138 89 mo 


والمطلوب معرفة أي الدواءين هو الأفضل. 


الحل 





x<-c(140,149,164,138,121,111,139,128,111) 
y<-c(110,89,113,128,111,125,110,90,140) 
| t.test(x,y) 
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الناتج 

| Welch Two Sample t-test 
| data: x andy 

t = 2.5477, df = 15.959, p-value = 0.02153 .1 

alternative hypothesis: true difference in means is not equal to 0 .2 

95 percent confidence interval: .3 

37.663323 3.447788 .4 

sample estimates: .5 

meanofy meanofx .6 


112.8889 133.4444 .1 





التفسير: 


في السطر الأول يعرض 8 إحصائية الاختبار t‏ وعدد درجات الحرية و p-value‏ (المعنوية) وقد 
كانت قيمة p-value=0.02153‏ والتي هي أقل yo‏ 0.05 وبالتالي نرفض الفرضية الابتدائية 
التي تقول بعدم وجود اختلاف معنوي بين سكر pal‏ في كل من المجموعتين؛ أي؛ 
يوجد اختلاف معنوي بين سكر الدم باستخدام العلاج الأول وسكر الدم باستخدام العلاج 
الثاني وذلك عند مستوى المعنوية %5. السطر الثاني يخبرنا بأن الفرضية البديلة تنص على 
أن الفرق بين متوسطي المجموعتين يختلف إحصائياً عن الصفر. ويقصد بالسطر الثالث أنه 
سيتم إظهار 95! فترة adi‏ للفرق بين متوسطي المجموعتين, وبالسطر الرابع تم عرض 
فترة الثقة والتي كانت [3.45,37.66] والتي تعني ail‏ وبثقة %95 في المجتمع الأصلي 
الذي سحبنا منه عينتنا لن يكون الفرق بين متوسطي المجموعتين أقل من 3.45 ولا أكبر 
من 37.66. أما السطر الخامس فمعناه: مقدرات العينة. والسطر السادس يعني متوسط x‏ 
ومتوسط y‏ والتي تم إظهار كل منها في السطر lwl‏ ويمكن تقدير متوسط المجتمع 
الذي سحبت ain‏ العينة x‏ ب 133.44 ومتوسط المجتمع الذي سحبت ain‏ العينة y‏ ب 
112.89. 


R البرمجة الإحصائية‎ ao) 


(Paired- Sample t-test) اختبار ستيودينت للعينة المزدوجة‎ WU 
يستخدم اختبار ستيودينت للعينة المزدوجة (العينتين المرتبطتين) لاختبار الفرضية:‎ 
Hx =e 
مقابل:‎ 
Baa See 
في ظرف ما عن متوسط العينة نفسها في ظرف‎ F, أي لاختبار اختلاف متوسط العينة‎ 
ومعرفة إذا كان هذا الفرق هو فرق ذو أهمية إحصائية أو أنه فقط بمجرد الصدفة.‎ z آخر‎ 
هناك حالة أعم لاختبار ستيودينت للعينة المزدوجة وتصاغ فرضيتاه بالشكل:‎ 
Ho: X4 — X, = 1 
مقابل:‎ 
Hy:X%,—X2,#m 
m Jio يساوي مقدار ثابت‎ ×, Z2 والذي يدرس معنوية كون الفرق بين‎ 
للتطبيق باستخدام 8 نكتب التعليمة:‎ 


t.test(x,y,mu=m,paired=T) | 


ويمكن إهمال الوسيط الثالث في حال كان m=0‏ 





شروط تطبيق اختبار t‏ للعينة المزدوجة 
أن يكون متغير الدراسة كميا. 
أن يتوزع فرق العينتين وفق التوزيع الطبيعي. 
أن تكون العينتان عبارة عن عينة واحدة مقاسة في ظرفين مختلفين. 
عدم وجود قيمة شاذة. 


أن يكون حجم العينة يشكل %5 على الأقل من حجم المجتمع. 





نت OD‏ ل ص 





Lind‏ بتطبيق نظام حمية على عينة من النساء لمدة شهر وقمنا Lawi‏ أوزانهن قبل 
وبعد الحمية فكانت النتائج كما يلي: 


65 66 62 59 62 74 63 69 65 


[ze | 60 60 59 58 54 67 58 62 60 





محمد بشر زينه 


والمطلوب معرفة Laó‏ إذا كانت الحمية مجدية. 









x<-c(65,69,63,74,62,59,62,66,65) 
y<-c(60,62,58,67,54,58,59,60,60) 
t.test(x,y, paired=T) 


الناتج 


Paired t-test 


data: x andy 

t = 7.2308, df = 8, p-value = 8.972e-05 .1 

alternative hypothesis: true difference in means is not equal to 0 .2 
95 percent confidence interval: .3 

3.556775 6.887670 .4 

sample estimates: .5 

mean of the differences .6 


5.222222 .2 








التفسير: 


في السطر الأول Wyo)‏ 8 إحصائية الاختبار t‏ وعدد درجات الحرية و p-value‏ (المعنوية) وقد 
كانت قيمة p-value=0.0000897‏ والتي هي أقل من 0.05 وبالتالي نرفض الفرضية الابتدائية 
التي تقول بعدم وجود اختلاف معنوي بين الأوزان في كلتي الحالتين. 


أي يوجد اختلاف معنوي بين أوزان النساء قبل الحمية وأوزان النساء بعد الحمية وذلك عند 
مستوى المعنوية %5. السطر الثاني يخبرنا yb‏ الفرضية البديلة تنص على أن الفرق بين 
متوسط المجموعتين يختلف إحصئياً عن الصفر. ويقصد بالسطر الثالث أنه سيتم إظهار 
5 فترة ثقة Gal‏ بين متوسطي المجموعتين. وبالسطر الرابع تم عرض فترة الثقة 
والتي كانت [3.56,6.89] والتي تعني أنه وبثقة %95 في المجتمع الأصلي الذي سحبنا 
aio‏ عينتنا لن يكون الفرق بين متوسطي المجموعتين أقل من 3.56 ولا أكبر من 6.89, Lol‏ 
السطر الخامس فمعناه: مقدرات العينة. والسطر السادس يعني متوسط الفرق بين 
المجموعتين والذي aiw‏ إظهاره في السطر السابع. ويمكن تقدير متوسط الفرق بين 
أوزان النساء قبل وبعد الحمية ب 5.22. 
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تحليل التباين أحادي الاتجاه (One Way ANOVA)‏ 
يستخدم اختبار تحليل التباين أحادي الاتجاه لدراسة وجود فروق معنوية بين عدة 
مجموعات,. أي لاختبار الفرضية: 


مقابل: 
Hı: X; # x; for some i, j‏ 
ويمكن إجراء الاختبار باستخدام 8 بالخطوات الآتية: 


data frame لعرف‎ .| 


2 نقوم بعملية stack‏ لل data frame‏ ونحفظها في متغير جديد وليكن Xs‏ 
ل 


aov(values~ind,data=xs) | 





One Way ANOVA تطبيق اختبار‎ bop 
0S أن يكون متغير الدراسة‎ 
أن تتوزع البيانات لكل من العينات وفق التوزيع الطبيعي.‎ 
تجانس تباين العينات‎ 
أن تكون العينات مستقلة.‎ 
عدم وجود قيمة شاذة.‎ 


أن يكون حجم العينة يشكل 5؟ على الأقل من حجم المجتمع. 


on kh wo ند قثأ‎ 








مثال: 
لدراسة الاختلاف في معدلات الطلاب باختلاف طريقة التدريس كانت لدينا النتائج AUT!‏ 











75 84 88 
77 | 87 | 82. 
72 83 87 
78 77 89 
89 79 83 
79 | 82 | 85 | 
281 79 89 
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حيث تمثل A‏ طريقة التدريس التقليدية. و B‏ التدريس مع جهاز إسقاط. و 6 التدريس مع 
مذاكرات دورية. 


الحل 
a<-c(75,77,72,78,89,79,81)‏ 
b<-c(84,87,83,77,79,82,79)‏ 
c<-c(88,82,87,89,83,85,89)‏ 
x<-data.frame(a,b,c)‏ 
xs<-stack(x)‏ 
anova<-aov(values~ind,data=xs)‏ 
summary(anova)‏ 





ail 
Df Sum Sq MeanSq _ Fvalue _ Pr(>F) 
ind 2 196.6 98.29 6.017 0.00997 ** 
Residuals 18 294.0 16.33 


Signif. codes: O ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’0.1 ‘71 








والذي ings‏ من الناتج هو القيمة p=0.00997‏ والتي هي أقل yo‏ 0.05 وبالتالي نستنتج 
أن طريقتين على الأفل yo‏ الطرائق الثلاثة تختلفان عن بعضهما البعض اختلافاً „giov‏ 
وبالتالي نسأل السؤال الآتي: i‏ ب الطرائة ب التي تختلف | S‏ 





اختبار ‘Tukey HSD‏ 
يستخدم اختبار Tukey‏ بعد تطبيق اختبار ANOVA‏ وملاحظة أن p<0.05‏ وذلك لمعرفة أي 
المجموعات هي التي تختلف عن بعضها البعض اختلافاً معنوياً. وذلك بالشكل: 


حيث anova‏ هو متحول حفظت فيه نتيجة اختبار ANOVA‏ وفي lio‏ السابق تكون النتيجة: 





الحل 
TukeyHSD(anova)‏ 
ail‏ 
Fit: aov(formula = values ~ ind, data = xs)‏ 
ind$‏ 
diff lwr upr p adj‏ 


b-a 2.857143 -2.656160 8.370445 0.4013131 
c-a 7.428571 1.915269 12.941874 0.0078367 
c-b 4.571429 -0.941874 10.084731 0.1145678 
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التفسير: 


يمثل السطر b-a‏ مقارنة المجموعتين A‏ و 8. فالقيمة 2.857 تمثل الفرق في المتوسطات 
B-A‏ وتمثل القيمة 2.656- aJI‏ الأدنى dia %95J‏ ثقة للفرق بين المتوسطين. وتمثل 
القيمة 8.370 الحد الأعلى ل%95 فترة ثقة للفرق بين المتوسطين. والقيمة الأخيرة 0.401 
Jini‏ معنوية هذا الفرق وهو غير معنوي كونه أكبر من 0.05. ونلاحظ من الجدول السابق 
أن المجموعتين 6 و 8 هما المجموعتان الوحيدتان اللتان تختلفان معنوياً عن بعضهما 
البعض كون 20.007>0.05م. 


تحليل التباين ثنائي الاتجاه (Two Way ANOVA)‏ 

يستخدم تحليل التباين ثنائي الاتجاه لدراسة تأثير عاملين على متفير محدد. مثل تأثير 
الجنس والحالة الاجتماعية على معدلات الطلاب أو pili‏ طريقة الري ونوع slow!‏ على 
كمية الإنتاج. ويمكن إجراء الاختبار باستخدام 8 بالخطوات الآتية: 


values على المتغير التابع‎ ngia myData وليكن‎ lo awl data frame ا. نعرف‎ 
factore والعامل الثاني‎ factor] والعامل الأول‎ 
Ania) STS 


aov(values~factor1*factor2,data=myData) | 


شروط تطبيق اختبار Two Way ANOVA‏ 
أن يكون متغير الدراسة كمياً. 
أن تتوزع البيانات لكل من العينات وفق التوزيع الطبيعي. 
عدم وجود قيمة شاذة. 


أن يكون حجم العينة يشكل %5 على الأقل من حجم المجتمع. 








ند دآ نه ak‏ 
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لنفرض أننا نود دراسة تأثير كل من الجنس وطريقة العلاج على سكر الدم. وكان لدينا: 


Glucose Gender | Medicine 
168 Male Lantus+R 
187 Female Mix 
165 Male Lantus 
198 Female Lantus+R 
178 Male Mix 
128 female Lantus 
145 Male Lantus+R 
197 Female Mix 
188 Male Lantus 
169 Female Lantus+R 
168 Male Mix 
180 Female Lantus 
210 Male Lantus+R 
211 female Mix 
114 Male Lantus 
112 female Lantus+R 
129 Male Mix 
90 Female Lantus 
NS Male Lantus+R 
120 female Mix 
100 Male Lantus 











سنطبق تحليل التباين ثنائي الاتجاه ai)‏ لدينا عاملان ومتغير تابع: 




































































لفة البرمجة الإحصائية 8 


Glucose<- 
c(100,120,115,90,129,112,114,211,210,180,168,169,188,197,145,128,178,198,165,187,168) 
Gender<-c(1,2,1,2,1,2,1,2,1,2,1,2,1,2,1,2,1,2,1,2,1) 
Medicine<-c(1,1,1,1,1,1,1,2,2,2,2,2,2,2,3,3,3,3,3,3,3) 
myData<-data.frame("Glucose"=Glucose,"Medicine"=Medicine," Gender"=Gender) 
myDataS$ Medicine<-factor(myData $Medicine,levels=c(1,2,3),labels=c("Lantus + 
R","Mix","Lantus")) 

myDataSGender<-factor(myData $Gender,levels=c(1,2),labels=c("Male","Female")) 
anova<- aov(Glucose~Medicine* Gender,myData) 

summary(anova) 








Df Sum Sq Mean Sq Fvalue Pr(>F) 


Medicine 2 22376 11188 26.967 1.08e-05 *** 
Gender 1 0 0 0 0.988 
Medicine:Gender 2 173 86 0.208 0.815 
Residuals 15 6223 415 


Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘’ 1Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 
| 0 4.0.1 ‘7 1 








من الجدول السابق cgi ail boli‏ العلاج فقط pili‏ معنوي على معدل سكر الدم كون 
.p<0.05‏ وليس هناك اختلاف بمستويات سكر الدم باختلاف الجنس. ولا تفاعل مشترك بين 
الجنس ونوع العلاج. لكن السؤال: ما هو العلاج الأكثر تأثيراً؟ 
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‘Tukey HSD عودة لاختبار‎ 


One Way ANOVA كما طبقناه مع‎ Two Way ANOVA مع‎ TukeyHSD نستطيع تطبيق اختبار‎ 


لكن يفضل عدم إدخال المتفيرات غير المعنوية. وذلك بالشكل: 


TukeyHSD(anova,wich="significantFactors”) | 


وفي مثالنا السابق يكون لدينا: 


الحل 


TukeyHSD(anova,which="Medicine") 
الناتح‎ 





Tukey multiple comparisons of means 
95% family-wise confidence level 


Fit: aov(formula = Glucose ~ Medicine * Gender, data = myData) 


SMedicine 

diff Iwr upr p adj 
Mix-Lantus + R 77.57143 49.29180 105.851059 0.0000099 
Lantus-Lantus +R 55.57143 27.29180 83.851059 0.0003589 
Lantus-Mix -22.00000 -50.27963 6.279631 0.1413899 











ونلاحظ 2999 فرق معنوي بين مستخدمي cus Lantus+R g Mix Insulin‏ كان سكر الدم 


لمستخدمي Lantus+R‏ أكثر انضباطاً, وكذلك يوجد فرق معنوي بين مستخدمي Lantus‏ 


ومستخدمي Lantus+R‏ وكان سكر الدم لمستخدمي Lantus+R‏ أيضا أفضل. 
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الفصل العاشر 
العلافة بين المتغيرات والانحدار 
(Correlation and Regression)‏ 


معامل ارتباط بيرسون (Pearson Correlation Coefficient)‏ 
يستخدم معامل ارتباط بيرسون لدراسة 3999 علاقة بين متغيرين كميين X‏ و Y‏ وشدة هذه 
العلاقة. حيث يقع معامل الارتباط yoo‏ المجال )1,1-[ وكلما اقتربت قيمته المطلقة من 
الواحد Wa‏ هذا على أن العلاقة أقوى,. Lol‏ عند اقتراب قيمته المطلقة من النصف تكون 
العلاقة متوسطة, وعند اقتراب قيمته من الصفر تكون العلاقة ضعيفة, والإشارة الموجبة 
لمعامل الارتباط Jai‏ على أن العلاقة طردية, Lol‏ الإشارة السالبة فتدل على أن العلافة 

عكسية. بعد حساب معامل الارتباط 8 يتم اختبار الفرضية: 
Ho:R =0‏ 
مقابل 
Hy:R #0‏ 
ونقوم بدراسة gag X,Y Wolo yu adios!‏ معامل ارتباط بيرسون باستخدام التعليمة: 


cor.test(x,y) 


Gubi bgi‏ معامل ارتباط بيرسون الخطي 
أن يكون متغيرا الدراسة كميين. 
أن تتوزع البيانات لكل من العينتين وفق التوزيع الطبيعي. 
أن تكون العلاقة بين المتغيرين خطية (نتحقق من ذلك برسم مخطط الانتشار). 
. ثبات التباين Homoscedasticity‏ حول خط الانتشار (يجب أن يكون الانتشار على شكل 
سيجار تقريبا). 
عدم وجود قيمة شاذة. 


6 أن يكون حجم العينة يشكل %5 على الأقل من حجم المجتمع. 





bh تن ا‎ fw LL 


un 
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لنولد شعاعين “لا عشوائياً وندرس العلاقة ‘Login‏ 





الحل 
x<-rnorm(50)‏ 
y<-rnorm(50)‏ 
cor.test(x,y)‏ 

الناتج 





Pearson's product-moment correlation 


data: x andy 
t = 0.1508, df = 48, p-value = 0.8808 
alternative hypothesis: true correlation is not equal to 0 
95 percent confidence interval: 
-0.2581507 0.2983015 
sample estimates: 
cor 
| 0.02176061 








والذي ings‏ أولاً هو القيمة p=0.8808‏ والتي هي أكبر من 0.05 وبالتالي نستنتج أنه لا 
توجد علاقة معنوية بين Y g X‏ كما R Lho;‏ %95 فترة adi‏ لمعامل الارتباط وهي 
[0.258,0.28-] أي أنه وبثقة %95 سيكون R‏ للمجتمع بين 25.8%- و 29.8% حيث كان R‏ من 
العينة 0.022 وهو صغير las‏ وهو سبب كونه ليس gion‏ 


الارتباط لا يعني السببية (Correlation Versus Causality)‏ 

الارتباط يعني وجود علاقة بين المتغيرين XY‏ لكن ليس من الضرورة أن هذه العلاقة تعني 
السببية. أي أن وجود علاقة بين X,Y‏ لا تعني أن × يسبب ل أو أن Y‏ يسبب ×. بل قد يكون 
هناك متغير ما مثل 7 هو الذي يسببهما. 

من الأمثلة التي طرحت هذا النقاش أن أحد الباحثين وجد علاقة بين تناول المثلجات والقيام 
بالجرائم في New York‏ وطرح السؤال الآتي: هل Jg‏ المثلجات Jor‏ الشخص مجرماً؟ 
الإجابة عن هذا السؤال كانت لا, إنما المتغيران السابقان متأثران بالطقس, ففي الهجمات 
الحرارية الشديدة يرتفع كل من معدل تناول المثلجات ومعدل الجرائم مما يشكل ارتباطاً 
زائفاً بفعل متغير وسيط وهو الطقس. ويمكن استبعاد أثر هذا المتغير باستخدام ما يعرف 
بالارتباط الجزئي. 





R البرمجة الإحصائية‎ ao) 


الارتباط الجزئي (Partial Correlation)‏ 
كما سبق وقلنا إن الارتباط الجزئي يستخدم لدراسة العلاقة بين متغيرين X‏ و Y‏ بعد إزالة أثر 
poio‏ آخر .Z‏ ولتطبيق الارتباط الجزئي في 8 سنحتاج للحزمة .ppcor‏ والتعليمة اللازمة 

لحساب الارتباط الجزئي هي كالآتي: 


install.packages("ppcor") 


library("ppcor") 
pcor.test(x,y,z) 





ولد ثلاثة أشعة X,Y,Z‏ واحسب العلاقة بين XY‏ مع استبعاد أثر Z‏ 


x<-rnorm(50) 
y<-rnorm(50) 
z<-rnorm(50) 
install.packages("ppcor") 
library("ppcor") 
pcor.test(x,y,z) 


estimate p.value statistic n gp Method 
1 0.2576389 0.07390174 1.827994 50 1 pearson 


ونلاحظ مما سبق أنه لا علاقة معنوية بين X‏ و Y‏ (0.05<م) بعد استبعاد أثر Z‏ 








ملاحظة: 
يمكن إيجاد مصفوفة الارتباط لأكثر من شعاعين باستخدام نفس التعليمة cor(A)‏ حيث 


أن A‏ هو متغير معرف على أنه matrix‏ كما يمكن إيجاد مصفوفة التغاير باستخدام 
التعليمة .cov(A)‏ 





103 | Page 








محمد بشر زينه 


الانحدار الخطي البسيط (Simple Linear Regression)‏ 
يقصد بالانحدار الخطي البسيط دراسة تأثير المتفير X‏ والذي nea‏ المتغير المستقل 
(independent Variable)‏ على المتغير لا والذي nes‏ المتغير التابع (Dependent Variable)‏ 


يعطى gigo‏ الانحدار الخطي بالشكل: 
Y = bo + BX +€;€~N(0,07)‏ 


حيث ندعو e‏ بالراسب أو الخطأ. ويهدف تحليل الانحدار إلى slay!‏ مقدرات لكل من Bo, By‏ 
والتي تجعل مجموع مربعات الرواسب أصغر ما يمكن. 


لتطبيق الانحدار الخطي البسيط باستخدام 8 نكتب التعليمة: 


شروط تطبيق الانحدار الخطي البسيط 
أن يكون كل من المتغير التابع والمتغير المستقل كميين. 
عدم وجود علاقة غير خطية بين الرواسب و Y‏ المقدرة. 
استقلال الرواسب. 
التوزيع الطبيعي للرواسب. 
تجانس التباين. 
عدم وجود قيم شاذة. 
أن يكون حجم العينة Jus‏ 





KR © wD XL‏ ي © ا 








أوجد معادلة الانحدار الخطي البسيط التي تمثل دور الطول بالتنبؤ بالوزن بالاعتماد على 
العينة الآتية: 


160 167 170 175 174 169 168 163 الطول 


58 65 73 74 78 65 67 61 الوزن 





x<-c(160,167,170,175,174,169,168, 163) 
y<-c(58,65,73,74,78,65,67,61) 
Im(y~x) 
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الناتج: 
Call:‏ 
Im(formula = y ~ x)‏ 
Coefficients:‏ 


(Intercept) x 
-145.851 1.269 








التفسير: 
يهمنا من الجدول السابق قيما intercept‏ و x‏ حيث تمثل intercept‏ المعامل By‏ وتمثل 
قيمة x‏ المعامل ,8 وبالتالي إن معادلة الانحدار التي تمثل إسهام Job!‏ × بالتنبؤ بالوزن 
Y‏ هي: 

Y = -145.851 + 1.269 X 
Qu إن هذه المعادلة غير كافية إحصائياً, فيجب دراسة مدى كفاءة هذه المعادلة‎ 
ومدى جودتها ومعنويتها. وهذا يتم بالشكل الآتي:‎ 


reg<-Im(y~x) 
summary(reg) 





الناتج: 
Call:‏ 
Im(formula = y ~ x)‏ 


1. Residuals: 
2. Min 1Q Median 3Q Max 
3. -3.5766 -1.3266 -0.1358 1.4018 3.1546 


4. Coefficients: 


i. Estimate Std. Error t value Pr(>|t]) 
(Intercept) -145.8510 31.9907 -4.559 0.003854 ** 
x 1.2688 0.1901 6.676 0.000547 *** 


Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’0.1‘7 1 


الغ د ال Go‏ 


9. Residual standard error: 2.546 on 6 degrees of freedom 
10. Multiple R-squared: 0.8813, Adjusted R-squared: 0.8616 


11. F-statistic: 44.57 on 1 and 6 DF, p-value: 0.0005471 
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ea 
أي الفرق بين القيم‎ (Residuals) السطر الأول يوضح أن المخرجات الآتية هي للبواقي‎ 
الفعلية والقيم المتنبأة. فيظهر في السطر الثالث على الترتيب أصغر راسب. والربيع الأول‎ 
للرواسب ووسيط الرواسب. والربيع الثالث للرواسب, وأكبر راسب.‎ 

في السطر الرابع يوضح أن المخرجات الآتية هي معاملات النموذج ويمثل السطر الخامس 
al‏ الثابت yo‏ نموذج الانحدار وقيمته في مثالنا 145.851- = وم بخطأ معياري 31.99 
وإحصاء اختبار معنوية هذا المعامل يخضع لتوزيع ستيودينت وقيمته 4.559— = t‏ وهو 
معنوي کون 0.05 > .p — value‏ 

يمثل السطر السادس المعامل ,6 الذي كانت قيمته 1.2688 = رم بخطأ معياري 0.1901 
وإحصاء اختبار معنوية هذا المعامل يخضع أيضاً لتوزيع ستيودينت وقيمته 6.676 = t‏ وهو 
معنوي کون 0.05 > .p — value‏ 

في السطر الثامن يبين WR‏ تفسيره لمعنوية المعاملات حيث يصطلح Foul R‏ *** 
للمعاملات ذات المعنوية العالية las‏ والرمز ** للمعنوية العالية والرمز * للمعنوية العادية. 
السطر التاسع يبين الخطأ المعياري للرواسب والذي قد كان 2.546 ب 6 درجات حرية أما 
السطر العاشر فيبين قيمة معامل التحديد 0.8813 = 82 والذي يعني بمثالنا أن 88.13% من 
poill‏ في الوزن هو بسبب التغير في الطول. أو أن الطول يفسر 88.138 من التفير في 
الوزن. كما يبين في السطر awa)‏ قيمة معامل التحديد المعدل والذي بلغ في نموذجنا 
5 ويستخدم معامل التحديد المعدل Jay‏ من معامل التحديد العادي في حال كان 
حجم العينة صغيراً. 

phul‏ الأخير يظهر الإحصائية العامة عن معنوية النموذج حيث بلغت قيمة clos!‏ الاختبار 
7 =۴ بدرجة حرية واحدة للبسط وست درجات ayo‏ للمقام وبمعنوية 
p — value > 5‏ أي أن النموذج المقترح هو نموذج معنوي. 

في Gigi!‏ نستطيع GUS‏ معادلة الانحدار الممثلة WY‏ بالشكل: 


Weight = —145.851 + 1.269 x Height 
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الانحدار الخطي المتعدد (Multiple Linear Regression)‏ 
andy‏ بالاتكدار الخظطى المتعدد دراسة (aaile) pI‏ عدة ljeto‏ ر .× > لدع 
المتغيرات المستقلة (Independent Variables)‏ على Y pain‏ يدعى المتغير التابع 

(Dependent Variable) 
يعطى نموذج الانحدار الخطي المتعدد بالشكل:‎ 
Y = Bo + BıXı + 2X2 + © + ByXp + €; €~N(0,07) 


لتطبيق الانحدار المتعدد باستخدام 8 نكتب التعليمة: 


Im(y~x1+x2+...+xp) | 





شروط تطبيق الانحدار الخطي البسيط 
أن يكون كل من المتغير التابع والمتفيرات المستقلة كمية. 
عدم وجود علاقة غير خطية بين الرواسب و Y‏ المقدرة. 
استقلال الرواسب. 
التوزيع الطبيعي للرواسب. 
ثبات التباين. 
عدم وجود مصاحبة خطية متعددة (Multicollinearity)‏ بين المتفيرات المستقلة. 
عدم وجود قيم شاذة. 
أن يكون حجم العينة Jus‏ 








لذ قل KR DO‏ طن © بغ o‏ 


أوجد معادلة الانحدار الخطي البسيط التي تمثل دور الطول وسكر الدم بالتنبؤ بالوزن 
بالاعتماد على العينة الآتية: 







172 178 162 175 167 163 170 الطول 


70 80 60 75 60 59 20 الوزن 
Petpet 165 94 89 119 100 128 113‏ 





y<-c(70,80,60,75,60,59,90) 
x1<-c(172,178,162,175,167,163,170) 
x2<-c(113,128,100,119,89,94,165) 
Im(y~x1+x2) 
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الناتج: 
Call:‏ 
Im(formula = y ~ x1 + x2)‏ 


Coefficients: 
(Intercept) x1 x2 
-65.4312 0.5425 0.3812 








يهمنا من الجدول السابق 014 intercept‏ و x29 x١‏ حيث تمثل By Joleoll intercept‏ وتمثتل 
قيمة 1× المعامل ,£ وقيمة x2‏ المعامل رم وبالتالي إن معادلة الانحدار التي تمثل إسهام 
الطول X,‏ وسكر الدم Quill X‏ بالوزن لا هي: 

Y = —65.43 + 0.54X, + 0.38X> 
Quill إن هذه المعادلة غير كافية إحصائيا. فيجب دراسة مدى كفاءة هذه المعادلة‎ 
ومدى جودتها ومعنويتها. وهذا يتم بالشكل الآني:‎ 


reg<-Im(y~x1+x2) 


| summary(reg) 
الخرج:‎ 






Call: 
Im(formula = y ~ x1 + x2) 


1. Residuals: 
2 1 2 3 4 5 6 7 
3. -0.96309 0.06308 -0.58168 0.12187 0.89944 0.16328 0.29711 


4. Coefficients: 


Estimate Std. Error t value Pr(>|t]) 
(Intercept) -65.43125 9.28691 -7.046 0.002139 ** 
x1 0.54252 0.05879 9.228 0.000766 *** 
x2 0.38125 0.01354 28.160 9.46e-06 *** 


Go SI Ge &‏ ا 


Signif. codes: O ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 “.’0.1‘’1 


10. Residual standard error: 0.7431 on 4 degrees of freedom 
11. Multiple R-squared: 0.9974, Adjusted R-squared: 0.9961 
12. F-statistic: 762 on 2 and 4 DF, p-value: 6.853e-06 














لفة البرمجة الإحصائية R‏ 


التفسين: 


السطر الأول يوضح أن المخرجات الآتية هي للبواقي (الرواسب) (Residuals)‏ أي الفرق بين 
القيم الفعلية والقيم المتنبأة, فيظهر في السطر الثالث قيم الرواسب. 

في السطر الرابع يوضح أن المخرجات الآتية هي معاملات النموذج ويظهر في كل من 
السطر الخامس والسادس والسابع قيم المعاملات وخطأها المعياري وإحصائية اختبارها 
ومعنويتها على الترتيب. ونلاحظ في مثالنا أن كافة المعاملات معنوية. 


في السطر التاسع يبين WR‏ تفسيره لمعنوية المعاملات حيث يصطلح joi R‏ *** 
للمعاملات ذات المعنوية العالية las‏ والرمز ** للمعنوية العالية والرمز * للمعنوية العادية. 
السطر العاشر يبين الخطأ المعياري للرواسب والذي قد كان 0.7431 ب 4 درجات حرية أما 
السطر الحادي pie‏ فيبين قيمة معامل التحديد 0.9974 = R?‏ والذي يعني بمثالنا أن 
4 من التغير في الوزن هو بسبب التغير في الطول وسكر „oal‏ أو أن الطول وسكر 
الدم يفسران 899.74 من التفير في الوزن. كما يبين في السطر نفسه قيمة معامل 
التحديد المعدل والذي بلغ في نموذجنا %99.61 ويستخدم معامل التحديد المعدل Yay‏ 
من معامل التحديد العادي في حال كان حجم العينة صغيراً. 


السطر الأخير يظهر الاحصائية العامة عن معنوية النموذج حيث بلغت قيمة clos!‏ الاختبار 
F = 2‏ بدرجتي حرية للبسط وأربع درجات ayo‏ للمقام وبمعنوية 0.05 > م أي أن 
النموذج المقترح هو نموذج معنوي. 
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التحقق من شروط الانحدار (Checking Regression Assumptions)‏ 


إن تحليل الانحدار حساس كثيراً لفرضيات تطبيقه النظرية. خاصة إذا كان الهدف استخدامه 
في التنبؤ. فلا يمكننا الاكتفاء yl‏ نجد أن معادلة الانحدار معنوية لاستخدامها في التنبؤ 


ستحتاج للحزمة car‏ في هذه الفقرة فلا تنس تحميلها. وسنقوم بكافة الاختبارات 
بالاعتماد على بيانات المثال الآتي: 


































التعليمة: 
x1<-rnorm(100,2,1)‏ 
x2<-rnorm(100,5,1)‏ 
y<-rnorm(1)*x1+rnorm(1)*x2+2*rnorm(1)‏ 
fit<-Im(y~x1+x2)‏ 
par(mfrow=c(2,2))‏ 
plot(fit)‏ 
par(mfrow=c(1,1))‏ 
Residuals vs Fitted Normal Q-Q‏ 
2 
i‏ 6 = 
f E‏ = 
E‏ 5 2 
E‏ 5 
Fitted values‏ 
Scale-Location‏ 
o1‏ 
2 20 83 5 
= | فى 5 
o =‏ 26° ° % 2 = 
E‏ ® 0 ° 8 
z =] 1 0 Be ° Zo o 3‏ 
E a jæ % go 85° Poo 3‏ 
é J? g oÈ SS °°? S‏ 
a‏ م D 5 8 Le‏ 
Oo‏ 
0.08 006 0.04 0.02 0.00 15- 20 25 3.0- 35 


Fitted values Leverage 
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الرسم السابق يظهر لنا الرواسب في أربع طرائق مختلفة. وسنبين فائدة كل منها: 


عدم وجود علاقة غير خطية بين الرواسب Yg‏ المقدرة (Nonlinearity)‏ 


الذي يختبر هذه الفرضية هو الرسم المسمى Residuals vs fitted‏ يجب ألا تكون هناك 
علاقة غير خطية بين الرواسب ول المقدرة لأن هذا يعني أنه هناك علاقة غير خطية بين 
المتغيرات المستقلة والمتغير التابع ولم يستطع النموذج تفسيرها. مما أدى لظهورها 
في الرواسب. فإذا رأيت أن الرواسب تنتشر بشكل عشوائي فإن هذا مؤشر a‏ على التزام 
نموذجك بهذه الفرضية. إما إذا كان للرواسب انتشار على شكل قطع مكافئ أو شكل 
أسي iio‏ فعليك أن تتخذ slo!‏ مناسباً لحل هذه المشكلة,. وفي مثالنا كان لدينا: 





عدم وجود علاقة غير خطية بين الرواسب و Y‏ المقدرة: 


Residuals vs Fitted 


18-15 


Residuals 
0e+00 





-1e-15 


-3.5 -3.0 25 -2.0 5 


Fitted values 








الرسم يبين عدم وجود أي انتشار للرواسب وفق اتجاه محدد والذي يعني التزام نموذجنا 
بالفرضية المطلوبة. 
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Lol‏ الشكل الآتي فيبين نموذجاً عن عدم الالتزام بهذه الفرضية: 


وجود علاقة غير خطية بين الرواسب و Y‏ المقدرة: 





Residuals vs Fitted 


0 
6 
O pog © 
o 
UG 
o Ti Fo 97 >° 





n 
© 
5 065 ° co) 
بج‎ Mig 

2 9 ويه 06 8 م6‎ 
g N 0 

co 

O o Ò 

T o 
O49 0 810 300 





-8 6 4 2 0 2 4 ô 


Fitted values 








حيث نلاحظ أن العلاقة بين الرواسب yg‏ المقدرة لها شكل قطع مكافئ تقريبا. 


التوزيع الطبيعي للرواسب (Normality)‏ 

الذي يختبر هذه الفرضية هو الرسم المسمى Normal Q-A‏ وحتى تلتزم الرواسب بالتوزيع 
الطبيعي يجب أن تتجمع النقاط على شكل خط مستقيم دون أن تنحاز aic‏ بشكل ملحوظ. 
وفي مثالنا كان لدينا: 





توزيع طبيعي للرواسب: 
Normal Q-Q‏ 
z 0‏ 
Š o‏ 
E q‏ 
a‏ 
+ 





Theoretical Quantiles 
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ونلاحظ أن WILLY‏ تلتزم بهذه الفرضية بشكل جيد. Lol‏ الشكل الآتي فيبين نموذجاً عن عدم 
الالتزام بهذه الفرضية: 


توزيع غير طبيعي للرواسب: 





| Normal Q-Q — 


Standardized residuals 
D 








Theoretical Quantiles 











تجانس التباين للرواسب (Homogeneity of Variance)‏ 
الذي يختبر هذه الفرضية هو الرسم المسمى Scale Location‏ فهو يختبر فيما إذا كانت 
الرواسب تنتشر بشكل متجانس على امتداد قيم المتغيرات المستقلة. فيجب أن يكون 
الانتشار على شكل مستقيم تتوزع حوله النقاط بتجانس على شكل سيجار تقريباً. Lol‏ عند 
عدم الالتزام بهذه الفرضية فقد نلاحظ أن النقاط تبدأ من الحافة اليسرى السفلى بشكل 

ضيق ثم la‏ بالتوسع نحو الزاوية اليمنى العليا. أو تبدأ بشكل متوسع ثم تتضيق. 
في مثالنا نجد أن بياناتنا تلتزم بهذه الفرضية حيث نلاحظ من الشكل أدناه أن النقاط تنتشر 
حول مستقيم على شكل سيجار تقريباً: 
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تجانس تباين الرواسب: 


IStandardized residuals! 








‘Standardized residuals! 


Fitted values 
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عدم وجود قيم شاذة (Outliers)‏ 

الذي يختبر هذا الشرط هو الرسم الأخير Residuals vs Leverage‏ ففي الانحدار قد cpp‏ من 
منظورنا أن بعض القيم شاذة. لكنها في الواقع لا تؤثر معنوياً في تقدير خط الانحدار, 
كما قد نرى أن بعض النقاط ليست شاذة وفي الواقع تكون شاذة بالنسبة لتقدير خط 
الانحدار كونها تغير الاتجاه العام لهذا ball‏ في هذا الرسم سنبحث عن النقاط الشاذة 
والتي ستتمركز في الزاوية العليا اليمنى أو الزاوية السفلى اليمنى. والتي ستكون خارج 
الخطوط المنقطة (---) وندعوها بمسافة Cook‏ 


في Wio‏ تقع جميع النقاط ضمن مسافة Cook‏ حيث كان لدينا: 





Residuals vs Leverage 





Standardized residuals 
0 











Leverage 








قد نشك في القيمة [N‏ لكن طالما هي لم تتجاوز الخطوط المنقطة فيمكن غض النظر 
ipie‏ 


Lol‏ الشكل الآتي فيبين الحالة التي يكون فيها نقاط شاذة يجب استبعادها: 
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قيمة شاذة يجب استبعادها: 





Residuals vs Leverage 


Standardized residuals 
2 0 
3 0 B 
0 
8 
o O- 


910 Cook's distance 
0.00 0.10 0.20 0.30 


Leverage 








نلاحظ في الشكل السابق أن النقاط مجمعة بشدة في الزاوية اليسرى وذلك لأن النقطة 
]49[ بعيدة كثيراً عنها. وقد تجاوزت الخطوط المنقطة بكثير. وبالتالي يجب استبعاد 
معطيات هذه النقطة. 


‘(Independence of Residuals) استقلال الرواسب‎ 

يجب ألا yg Si‏ الرواسب (الأخطاء) مرتبطة ببعضها odl‏ في pigoj‏ الانحدار الخطي, 

والذي يعني أن الخطأ في المستقبل anios‏ على الخطأ في الماضي,. ولاختبار هذه 

الفرضية يستحسن استخدام اختبار Durbin Watson‏ والذي يختبر الفرضية 0 = Ho:p‏ مقابل 

Hi: p #0‏ وذلك كما يلي: 

dibaya:‏ ا سنن 
durbinWatsontTest(fit)‏ 

وفي مثالنا لدينا: 


durbinWatsonTest(fit) 


lag Autocorrelation D-W Statistic p-value 
1 -0.06482485 1.88327 0.662 
Alternative hypothesis: rho != 0 


وكون 0.05<م فإننا لا نستطيع رفض الغرضية الابتداثية وبالتالي إن شرط استقلال الرواسب 
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المصاحبة خطية المتعددة (Multicollinearity)‏ 

ويقصد بها ارتباط بعض المتفيرات المستقلة go‏ بعضها Aol‏ وهذا غير جائز كوننا 
ندعوها (متغيرات مستقلة!). وعادة يستخدم معامل تضخم VIF WLU!‏ للتحقق من وجود 
المصاحبة الخطية المتعددة. فإذا كان VIF>5‏ لأي yo‏ المتفيرات | لمستقلة يحب i üde‏ 
هذا المتغير لارتباطه الشديد مع (أحد) أو (باقي) المتفيرات المستقلة الأخرى. يتم حساب 
VIF‏ باستخدام التعليمة:و 


وفي مثالنا لدينا: 


vif (fit) 





x1 x2 
1.010654 1.010654 





ونلاحظ أن قيم VIF‏ أصفر من 5 وبالتالي ليست لدينا مشكلة مصاحبة خطية. 


(Sample Size) حجم العينة‎ 


bi‏ للتأثير الكبير لحجم العينة في جودة نموذج الانحدار نشر العالم Green‏ عام 1991 ورقة 
بحثية حدد فيها حجم العينة المناسب لنموذح الانحدار كالآتي: 


1-إذا كان الهدف من النموذج حساب الارتباط المتعدد haa‏ فإن حجم العينة المناسب هو: 
م8 + 50 < N‏ حيث أن p‏ هو sac‏ المتغيرات المستقلة. 


2-إذا كان الهدف من النموذج معرفة مدى تأثير كل متغير مستقل في المتغير التابع فإن 
حجم العينة المناسب هو: N < 104 + p‏ 
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الفصل الحادي عشر 
الانحدار اللوجستي 
(Logistic Regression)‏ 


الانحدار اللوجستي هو نموذج يستخدم Qui‏ باحتمالية وقوع حدث ما وذلك بالاعتماد 
على متغيرات محددة نسميها المتفيرات المستقلة. والتي يمكن أن تكون كمية أو 
فئوية. على Juw‏ المثال: احتمالية حدوث نوبة ald‏ عند شخصٍ ما خلال فترة زمنية 
معينة يمكن Gull‏ بها من خلال معلومات عن yor‏ المريض وجنسه ومنسب كتلة الجسم 
لديه. يُستخدم الانحدار اللوجستي بشكل واسع في الطب والعلوم الاجتماعية. كما 
يستخدم في التسويق لحساب توقعات ميل المستهلك إلى شراء منتج ما أو امتناعه عن 
الشراء. 


ينقسم الانحدار اللوجستي إلى انحدار لوجستي ثنائي (Binary Logistic Regression)‏ 
وانحدار لوجستي متعدد (Multinomial Logistic Regression)‏ 


نكون أمام الانحدار اللوجستي الثنائي عندما يكون للمتغير التابع فئتان مثل التدخين 
(مدخن / غير مدخن). الحالة التعليمية (متعلم / غير متعلم). ... 


Lol‏ بالانحدار اللوجستي المتعدد فيكون للمتفير التابع أكثر yo‏ فئتين. Jio‏ المستوى 
المعيشي (سيئ / متوسط / جيد). الوجبة الأهم للفرد (فطور / غداء / Celie‏ ... 


Dogi lai‏ بالانحدار اللوجستي الثنائي: 
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الانحدار اللوجستي الثنائي (Binary Logistic Regression)‏ 
كما سبق وقلنا. إن الانحدار اللوجستي الثنائي يساعدنا على التنبؤ باحتمال الانتماء إلى 
aol‏ فش اضف فتوى 9 saloicJL‏ عل متقرات × > ا logeai‏ الفتفيراك 
| تقلة. ولتطبيق الانحدار اللوجستي الثنائي بعد تخزين WUW‏ في Data frame‏ لها 

الاسم myData‏ نستخدم التعليمة: 


bir<-glm(Y~X1+X2+...+Xp,data=myData,family=binomial) 
summary(blr) 





شروط تطبيق الانحدار اللوجستي الثنائي 
1. أن يكون المتغير التابع فئوياً وله مستويان فقط. 
2. عدم وجود مصاحبة خطية متعددة بين المتفيرات المستقلة. 
3 أن يكون هناك علاقة خطية بين المتغيرات المستقلة و log odds‏ حيث andi‏ بال 
Odds Ratio‏ أو ما يسمى بنسب الأرجحية: احتمال تحقق الظاهرة / احتمال عدم 
4 عدم 9169999 شاذة. 
5 أن يكون حجم العينة كبيرا. 








معايير دقة نموذج الانحدار اللوجستي الثنائي 
‘(Binary Logistic Regression Model fit and Accuracy)‏ 

في plaj‏ الانحدار كنا نتفحص 014 R*,RMSE‏ لتقييم نمونج الانحدار ومدى ملاءمته 
للبيانات. lol‏ في ploj‏ الانحدار اللوجستي توجد معايير أخرى سنقوم بسردها: 


معيار معلومات أكاكي (Akaike Information Criteria (AIC))‏ 
نستطيع اعتبار AIC joo‏ بديلاً عن R?‏ في نماذج الانحدار. فهو مؤشر هام جداً لملاءمة 
النموذج ويعتمد القاعدة: كلما كان yeni AIC‏ دلنا هذا على جودة أكبر للنموذج. ويمتاز 
معيار ail AIC‏ ينقص عند زيادة sac‏ المتفيرات المستقلة. مما يحل مشكلة الأرقام 
الوهمية الكبيرة التي تدل على ملاءمة كبيرة (مثل 1 = (R?‏ لكن مراقبة قيمة AIC‏ وحدها 
لن تعطينا الفائدة المرجوة. إنما الفائدة تنبع منها للمقارنة بين عدة نماذج لاختيار 

النموذج الأفضل والذي توافقه قيمة AIC‏ الأصفر. 
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(Null Deviance and Residual) الانحراف الابتدائي وانحراف الرواسب‎ 

‘Deviance 
حيث يعتبران مقياسين للخطأ في‎ loo لا تتم الاستفادة من هذين المقياسين إلا بذكرهما‎ 
النموذج. حيث يتم حساب الانحراف الابتدائي أولاً وهو مقياس للخطأ دون إدخال أي متغير‎ 
مستقل. ثم يتم حساب انحراف الرواسب بإدخال المتغيرات المستقلة وبهذه الحالة يفترض‎ 
إن كان للمتغيرات المستقلة إسهاماً جيداً في ملاءمة النموذج.‎ jen أن يكون الانحراف قد‎ 


مصفوفة الفوضى (Confusion Matrix)‏ 
وهي المعيار الأكثر حسما وشيوعاً لتقييم نماذج التصنيف ولها الشكل: 






السلبية الخاطئة الإيجابية الصحيحة 
| لاع TP‏ 
السلبية الصحيحة | الإيجابية الخاطئة 
TN‏ مع 





ونستطيع استخلاص المقاييس الآتية ‘gio‏ 
الضبط :(Accuracy)‏ ويحدد الدقة التنبؤية الكلية للنموذج ويحسب من العلاقة: 
Accuracy=(TP+TN)/(TP+F#N+FP+TN)‏ 


النسبة الإيجابية الصحيحة :True Positive Rate (TPR)‏ وتحدد عدد القيم الإيجابية من كل 
القيم الإيجابية والمصنفة بشكل صحيح وفق العلاقة: 


TPR=TP/(TP+FN) 
Sensitivity بالحساسية‎ Lay! ويعرف‎ 


النسبة الإيجابية الخاطئة :False Positive Rate (FPR)‏ وتحدد عدد القيم السلبية yo‏ كل 
القيم السلبية والمصنفة بشكل خاطئ وفق العلاقة: 


FPR=FP/(FP+TN) 















































لفة البرمجة الإحصائية R‏ 


النسبة السلبية الصحيحة :True Negative Rate (TNR)‏ وتحدد عدد القيم السلبية من كل 
القيم السلبية والمصنفة بشكل صحيح وفق العلاقة: 


TNR=TN/(TN+FP) 
Specificity وتعرف أيضاً بالخصوصية‎ 
وتحدد عدد القيم الإيجابية من كل‎ :False Negative Rate (FNR) النسبة السلبية الخاطئة‎ 
القيم الإيجابية والمصنفة بشكل خاطئ وفق العلاقة:‎ 


FNR=FN/(FN+TP) 


الدقة Precision‏ تحدد عدد القيم من جميع القيم التنبؤية الإيجابية والتي هي بالفعل 
إيجابية وفق العلاقة: 


Precision=TP/(TP+fP) 


نتيجة ۴ Score)‏ ۴): وهي المتوسط التوافقي ada‏ والحساسية وتتراوح قيمتها بين 
الصفر والواحد. وكلما اقتربت من الواحد كان النموذج أفضل: 


f=2(precision*sensitivity)/(precisiont+sensitivity) 


مثالزلتكن لدينا البيانات الآتية والتي تمثل 8 أشخاص مصابين بالسرطان و 8 أشخاص سليمين 
وعدد السجائر التي يدخنها كل منهم وجنسه: 


A ite O ا‎ IT i a O on o Ea o o 0o 





















































| 28 | 30 | 37 | 32 | 34 | 28 | 37 | 32 | 17 | 12 8 | 7 | 12 | 12 | 13 | 10 
1 2: د‎ -0 o 2ن 1 للضي‎ 1 1E 1E 


والمطلوب تشكيل نموذج الانحدار اللوجستي لمعرفة WL‏ كل من عدد السجائر والجنس 
على الإصابة بالسرطان. 
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الحل: 
cancer<-c(0,0,0,0,1,0,0,0,1,1,1,1,1,0,1,1)‏ 
gender<-c(2,1,2,1,2,1,2,1,2,1,2,1,2,1,2,1)‏ 
noCig<-c(10,13,12,12,7,8,12,17,32,37,28,34,32,37,30,28)‏ 
myData<-data.frame("noCig"=noCig,"gender"=gender, "cancer"=cancer)‏ 
bir<-glm(cancer~noCig+gender,data=myData,family=binomial)‏ 
summary(blr)‏ 


الناتج: 


Call: 
glm(formula = cancer ~ noCig + gender, family = binomial, data = myData) 


Deviance Residuals: 
Min 1Q Median 3Q Max 
-1.81722 -0.55619 0.04376 0.48011 1.81029 


Coefficients: 

Estimate Std. Error zvalue Pr(>|z|) 
(Intercept) -7.80396 4.31209 -1.810 0.0703 . 
noCig 0.18064 0.08391 2.153 0.0313 * 
gender 2.55845 1.86681 1.370 0.1705 


Signif. codes: O ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 “.’0.1‘’1 





(Dispersion parameter for binomial family taken to be 1) 


Null deviance: 22.181 on 15 degrees of freedom 
Residual deviance: 12.772 on 13 degrees of freedom 
AIC: 18.772 





Number of Fisher Scoring iterations: 5 


التفسير: 





نلاحظ أن المتفير الوحيد الذي يؤدي للإصابة بالسرطان هو عدد السجائر p=0.0313<0.05‏ 


وإدخال متغير عدد السجائر أبدى تحسيناً في النموذج بسبب Residual Deviance yl‏ أقل من 


AIC Lol .Null Deviance‏ على الرغم من Ojon‏ فلن نستطيع الاستفادة منها لتقييم النموذج 
ail)‏ وكما ذكرنا من قبل. تظهر فائدة معيار AIV‏ فقط عند بين المقارنة بين عدة نماذج.. 


السؤال الآن: وجدنا أن لعدد السجائر دوراً في الإصابة بالسرطان. لكن ما هو هذا الدور وما 


حجمه؟ ؟! 


R البرمجة الإحصائية‎ ao) 


نسب الأرجحية (Odds Ratio)‏ 
وتعني كم تغير زيادة المتغير المستقل بوحدة واحدة من احتمالية Ganj‏ الظاهرة 
المدروسة. وهي عبارة عن العدد النيبري مرفوعاً إلى معلمة المتغير في نموذج الانحدار 

اللوجستي. وفي مثالنا السابق: 








مثال: 
exp(cbind("OR"=coef(bir),confint(blr)))‏ 
الناتج: 
97.5% 9 2.5 08 
(Intercept) 4.081169e-04 7.603775e-10 0.205689‏ 
noCig 1.197983e+00 1.051239e+00 1.526905‏ 
gender 1.291574e+01 6.755416e-01 3116.431011‏ 





التفسير: 


وجدنا سابقاً أن aac‏ السجائر كان له تأثير معنوي على الإصابة بالسرطان. ومن الجدول 
السابق نجد أن OR=1.19798‏ وبالتالي إن زيادة sac‏ السجائر بسيجارة واحدة يؤدي إلى زيادة 
احتمالية aslo!‏ بالسرطان ب 19.79% وإن %95 فترة ثقة لنسب الأرجحية الموافقة لعدد 
السجائر هي ]0512,1.5269. 


بإمكاننا أخيراً إيجاد مصفوفة الفوضى بالشكل: 





مثال: 
table(myDataScancer,predict>0.5)‏ 
الناتج: 

FALSE TRUE 
0 7 1 
1 2 6 








81.25% دقة التصنيف:‎ 195 aing 
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الانحدار اللوجستي المتعدد (Multinomial Logistic Regression)‏ 
كما سبق läg‏ إن الانحدار اللوجستي المتعدد يساعدنا على التنبؤ باحتمال الانتماء إلى 
إحدى Glia‏ متفير فئوي لا (يمتلك أكثر من فئتين) بالاعتماد على متغيرات ولا Xz,‏ رلا 
ندعوها المتفيرات المستقلة. ولتطبيق الانحدار اللوجستي المتعدد بعد تخزين بياناتنا في 

Data Frame‏ لها الاسم myData‏ نستخدم التعليمة: 
library(“nnet”)‏ 


mlr<-multinom(Y~X1+X2+...+Xp,data=myData) 
summary(mIr) 





شروط تطبيق الانحدار اللوجستي المتعدد 
1. أن يكون المتغير التابع فئوياً وله أكثر من مستويين. 
2. عدم وجود مصاحبة خطية متعددة بين المتفيرات المستقلة. 
3 أن يكون هناك علاقة خطية بين المتفيرات المستقلة و log odds‏ حيث نقصد بال 
Odds Ratio‏ أو ما يسمى بنسب الأرجحية: احتمال تحقق الظاهرة / احتمال عدم 
4 عدم 9169999 شاذة. 
5 أن يكون حجم العينة كبيرآً. 








معايير دقة نموذج الاتحدار اللوجستي المتعدد 
(Multinomial Logistic Regression Model fit and Accuracy)‏ 
وهي نفسها معايير gigo ää‏ الانحدار اللوجستي الثنائي. 


مثال: لتكن لدينا GUL!‏ الآتية والتي هي عبارة عن 16 شخصاً من مهن مختلفة (1 طبيب) 
)2 مدرس) (3 محامي) ومدة تحملهم للاستفزاز بالساعات ومعدلاتهم الجامعية: 


E 1 1 1 1| 1 2) 2) 2) 2| 2] 33 3 3] 3) 3 


Peng: 2 5 [3 3 79 6 7 [8 8 7 8 [11 ]8 | 
j 95 92 97 96 91 80 81 83 86| 83| 89| 75| 72| 73 | 71 | 69 


والمطلوب تشكيل نموذج الانحدار اللوجستي للتنبؤ بمهنة الشخص بالاعتماد على alaoo‏ 
ومدى تحمله. 
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الحل: 
job<-c(3,3,3,3,3,3,2,2,2,2,2,1,1,1,1,1)‏ 
patience<-c(10,8,11,8,7,8,8,7,6,9,7,3,3,5,2,3)‏ 
avg<-c(69,71,73,72,75,89,83,86,83,81,80,91,96,97,92,95)‏ 
job<-factor(job)‏ 
myData<-data.frame("job"=job," patience"=patience,"avg"=avg)‏ 
model<-multinom(job~.,data=myData)‏ 
summary(model)‏ 
z <- summary(model)Scoefficients/summary(model)Sstandard. errors‏ 
p <- (1 - pnorm(abs(z), 0, 1))*2‏ 
p‏ 
exp(coef(model))‏ 





الناتج: 
Call:‏ 
multinom(formula = job ~ ., data = myData)‏ 


Coefficients: 

(Intercept) patience avg 
2 -5.178416 8.268146 -0.4500814 
3 7.109255 8.842592 -0.6608890 


Std. Errors: 

(Intercept) patience avg 
2 7.656485 29.93532 1.899482 
3 7.710670 29.93916 1.902437 


Residual Deviance: 9.934945 
AIC: 21.93494 


Intercept atience av 
2 0.4988224 0.7823942 0.8159 
3 0.3565274 0.7677249 0.7282978 





(Intercept) patience avg 
2 5.636929e-03 3897.715 0.6375763 
3 1.223236e+03 4 0.5163920 
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التفسير: 


نلاحظ أنه لا يساعد أي من التحمل أو المعدل على التنبؤ بعمل الشخص لأن م المحسوبة 
في كل الحالات التي تحتها خط أكبر من 0.05, لكن فرضاً لو كانت القيمة الموافقة ل avg‏ 
في السطر الثاني هي 0.00 بدلا من 0.8126959 عندها تفسر هذه القيمة yl‏ زيادة المعدل 
بعلامة واحدة Jai‏ على أن احتمال كون الشخص مدرساً أكثر ب 1/0.6375763=56.84% مرة 
من كونه Lub‏ 


ملاحظة: 
نستخدم نسب الأرجحية كما هي إذا كانت أكبر من الواحد. وهي Jai‏ في هذه الحالة 


على علاقة طردية. Loin‏ نأخذ 1/08 إذا كانت قيمة نسبة الأرجحية أقل من الواحد. وهي 
تدل في هذه الحالة على علاقة عكسية. 
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الفصل الثاني عشر 
الإحصاء اللامعلمي 


(Nonparametric Statistics) 


كل ما تم ذكره إلى YI!‏ يندرج تحت lo‏ يسمى الإحصاء المعلمي. andig‏ بالإحصاء 
المعلمي تلك الأساليب الرياضية التي نستخدمها ونطبقها على بيانات نكون على علم 
بتوزيعها وتلتزم بشروط محددة. وعند عدم معرفة توزيع البيانات أو عند عدم التزام 
البيانات بالشروط اللازمة لتطبيق اختبار محدد. ننتقل إلى أساليب أخرى ومنها الإحصاء 
اللامعلمي. 


اختبار ويلكوكسون للعينة الواحدة (One Sample Wilcoxon Test)‏ 
وهو البديل اللامعلمي لاختبار t‏ للعينة الواحدة. ويستخدم لاختبار فرق وسيط uc dite‏ 
ää‏ محددة aig mu=value‏ تطبيقه في R‏ بالشكل: 


wilcox.test(X, mu=value,alt=”two.sided”) 


مثال: 

لتكن لدينا قياسات سكر الدم لمجموعة من المرضى الذين تم علاجهم باستخدام الدواءين 
.Lantus+R‏ والمطلوب معرفة فيما إذا كان سكر الدم للعينة منضبطا. lale‏ أن سكر الدم 
الطبيعي لمرضى السكر يعتبر 110. 


140 90 110 125 111 128 113 89 110 


وقد طبقنا هذا المثال في الفصل التاسع باستخدام اختبار t‏ للعينة الواحدة. لكن الأفضل 
تطبيق اختبار لامعلمي كون حجم العينة صغيراً جداً. وسنطبق YU!‏ اختبار Wilcoxon‏ للعينة 
الواحدة: 





x<-c(110,89,113,128,111,125,110,90,140) 
wilcox.test(x, mu=110,alt="two.sided") 
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الناتج 
Wilcoxon signed rank test with continuity correction‏ 
data: x‏ 


V = 17, p-value = 0.6726 
alternative hypothesis: true location is not equal to 110 


نلاحظ من الجدول السابق أن 0.05<م وبالتالي لا )199 فرق معنوي بين سكر دم المرضى 
وسكر الدم الطبيعي. 








اختبار مان ويتني (Mann Whitney Test)‏ 
وهو البديل اللامعلمي لاختبار + للعينتين المستقلتين. ويستخدم لاختبار وجود فروق 
معنوية في وسيطي مجموعتين مستقلتئين. فلو كانت لدينا بيانات مخزنة في متغير 
oÜ‏ اسمه لا ومقسم إلى مجموعتين gag‏ متغير مستفل اسمه × يمكن اختبار الفرضية: 

Ho: median(Y,) = median(Y2)‏ مقابل Hy: median(Y,) + median(Y,)‏ بالشكل: 





مثال: لتكن لدينا قياسات سكر الدم لمجموعتين من المرضى حيث تأخذ المجموعة الأولى 
الدواء Lantus‏ وتأخذ المجموعة الثانية الدواءين -Lantus+R‏ 







m ww Bw m 2 18 64 149 140 

140 90 no 2 m #8 18 89 mo 

والمطلوب معرفة أي الدواءين هو الأفضل. هذا المثال نفسه تم als‏ في الفصل التاسع 
باستخدام اختبار t‏ والواجب استخدام اختبار Mann Whitney‏ لأن حجم العينة صفير جدا: 


الحل 
y<-c(140,149,164,138,121,111,139,128,111,110,89,113,128,111,125,110,90,140)‏ 
x<-c(rep(1,9),rep(2, 9)))‏ 
wilcox.test(y~x,mu=0,alt="two.sided", paired=F)‏ | 












ail 
| Wilcoxon rank sum test with continuity correction 
data: y by x 


W = 65, p-value = 0.03342 
_alternative hypothesis: true location shift is not equal to 0 
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التفسير: 


%5 يوجد فروق معنوية بين العلاجين عند مستوى المعنوية‎ UWL p<0.05 أن‎ Loy 


اختبار ويلكوكسون لعينتين مرتبطتين (Paired Samples Wilcoxon Test)‏ 
وهو البديل اللامعلمي لاختبار ا للعينتين المرتبطتين (العينة المزدوجة). ويستخدم لاختبار 
وجود فروق معنوية في وسيطي مجموعة في ظرفين مختلفين. فلو رمزنا للعينة في 
الظرف الأول = 4 لا وللعينة في الظرف الثاني ب لا عندها يمكن اختبار الفرضية: 

Ho: median(X) = median(Y)‏ مقابل H,:median(X) + median(Y)‏ بالشكل: 





مثال: lind‏ بتطبيق نظام حمية على dite‏ من النساء )620 شهر وقمنا Jowi‏ أوزانهن 


65 66 62 59 62 74 63 69 65 


Er 60 60 59 58 54 67 58 62 60 


والمطلوب معرفة فيما إذا كانت الحمية مجدية. هذا المثال نفسه تم als‏ في الفصل 
التاسع باستخدام اختبار t‏ والواجب استخدام اختبار Wilcoxon‏ لأن حجم العينة صغير Jap‏ 


الحل 
x<-c(65,69,63,74,62,59,62,66,65)‏ 
y<-c(60,62,58,67,54,58,59,60,60)‏ 
wilcox.test(x,y,mu=0,alt="two.sided", paired=T)‏ 
الناتج 
Wilcoxon signed rank test with continuity correction‏ 
data: x and y‏ 


V = 45, p-value = 0.008849 
| alternative hypothesis: true location shift is not equal to 0 
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التفسير: 
Loy‏ أن 0.05>م بالتالي يوجد فروق معنوية بأوزان النساء قبل الحمية وبعد الحمية عند 
مستوى المعنوية %5. 


اختبار كروسكال واليز (Kruskal Wallis Test)‏ 
وهو البديل اللامعلمي لاختبار One Way ANOVA‏ أي أنه يستخدم لدراسة وجود فروق 
معنوية بين عدة مجموعات. ويمكن تطبيقه بالشكل: 


kruskal.test(y~x,alt="two.sided”) 


مثال: 
لدراسة الاختلاف في معدلات الطلاب باختلاف طريقة التدريس كانت لدينا النتائج الآتية: 


70 89 88 
73 90 | 82 
72 | 95 | 87 
74 77 | 89 | 
75 | 79 83 
73 82 | 85 


271279 89 














حيث تمثل A‏ طريقة التدريس التقليدية. و B‏ التدريس مع جهاز إسقاط. و 6 التدريس مع 


مذاكرات دورية. 


الحل 
y<-c(70,73,72,74,75,73,71,89,90,95,77,79,82,79,88,82,87,89,83,85,89)‏ 
x<-rep(c(1,2,3),each=7)‏ 
kruskal.test(y~x)‏ 

الناتح 


Kruskal-Wallis rank sum test 


data: y by x 
| Kruskal-Wallis chi-squared = 13.544, df = 2, p-value = 0.001145 
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والذي Longs‏ من الناتج هو القيمة p=0.001145‏ والتي هي أقل من 0.05 وبالتالي نستنتج 
أن طريقتين على الأفل yo‏ الطرائق الثلاثة تختلفان عن بعضهما البعض اختلافاً „giov‏ 
وبالتالي نسأل السؤال الآتي: j i‏ تختلف عر | 5 





اختبار ويلكوكسون للمقارنات المتعددة وتصحيح هولم لقيمة المعنوية 
‘(Pairwise Wilcoxon and Holm Adjusted P-Value)‏ 

يستخدم الاختبار السابق بعد تطبيق اختبار Kruskal Wallis‏ وملاحظة p<0.05 yl‏ وذلك لمعرفة 
أي المجموعات هي التي تختلف عن بعضها البعض اختلافاً معنوياً. وذلك بالشكل: 





pairwise.wilcox.test(y,x,paired=F,p.adj=”holm”) 


وفي مثالنا نجد: 


pairwise.wilcox.test(y,x,paired=F,p.adj="holm") 





Pairwise comparisons using Wilcoxon rank sum test 


data: y and x 


1 2 
2 0.0063 = 
3 0.0063 0.6526 








P value adjustment method: holm |‏ 
وبالتالي إن الطريقة الأولى تختلف عن كل من الطريقة الثانية aUWIg‏ معنوياً علد 
مستوى المعنوية 9% 


توجد العديد yo‏ البدائل اللامعلمية التي يمكن الاطلاع عليها في الكتب المختصة 
وسنكتفي في WS‏ بهذا القدر. 
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الفصل الثالث عشر 
السلاسل الزمنية 


(Time Series) 


سنستعرض في هذا الفصل طريقة إجراء أهم التحليلات الأساسية للسلاسل الزمنية. وأول 
ما عليك فعله هو قراءة بيانات السلسلة الزمنية: 

(Time Series Data Reading) قراءة بيانات السلسلة الزمنية‎ 

سنعمل في هذا الفصل على بيانات جاهزة وسنبدأ بأعمار وفاة 42 ملكا lagli‏ لبريطانياً 
سنقوم باستيرادها من الرابط £https://robjhyundman.com/tsdidata/misc/kings.dat‏ 
وسنتجاهل أول ثلاثة أسطر كونها تحتوي عبارات توضيحية حول البيانات: 





kings <- scan("https://robjhyndman.com/tsdidata/misc/kings.dat",skip=3) 
ربطها بالزمن):‎ cpl) السابفة إلى سلسلة زمنية‎ GUL! هي تحويل‎ au II والخطوة‎ 


TE 
tskings <- ts(kings) 
tskings 
jl 
Time Series: 
Start = 1 
End = 42 
Frequency = 1 
[1] 60 43 67 50 56 42 50 65 68 43 65 34 47 34 49 41 13 35 53 56 16 43 69 59 48 59 86 55 68 
51 33 49 67 77 81 67 71 81 68 
[40] 70 77 56 


lind‏ باستخدام التابع ts)‏ لتحويل البيانات إلى بيانات سلسلة زمنية سنوية. Lol‏ إذا أردنا 
تحويلها إلى سلسلة زمنية شهرية بإمكاننا وضع الوسيط frequency=12‏ في التابع ts()‏ 
كما بإمكاننا جعلها سلسلة زمنية ربع سنوية بوضع الوسيط .frequency=4‏ بإمكاننا أيضاً 








تحديد تاريخ بداية السلسلة الزمنية باستخدام الوسيط start=c(year,month/quarter)‏ 
كما في المثال الآتي لبيانات أخرى تمثل sac‏ الولادات الشهرية في New York‏ من 1946 
حتى 1959 yo‏ الموقع: httos://robjhyndman.com/tsdidata/data/nybirths.dat‏ . 





Dec 
21.870 
22.073 
21.573 
22.025 
22.991 
23.981 
24.707 
25.180 
25.688 
26.881 
26.987 
27.735 
26.619 
27.897 





Nov 
21.672 
21.759 
21.059 
21.519 
22.084 
22.964 
23.162 
25.246 
24.712 
25.693 
26.291 
26.634 
25.912 


AIL NN AL 


Oct 
23.227 
23.110 
23.142 
22.907 
24.252 
25.110 
25.199 
26.462 
26.379 
27.784 
29.136 
28.484 
27.945 


Sep 
23.175 
23.105 
22.238 
23.262 
24.122 
25.014 
25.210 
26.268 
26.152 
27.914 
28.056 
29.048 
28.405 


Aug 
23.901 
23.824 
23.504 
23.748 
24.454 
25.618 
25.816 
26.606 
26.878 
28.599 
28.169 
28.141 
28.759 


30.000 


A oloill 
births <- scan("https://robjhyndman.com/tsdldata/data/nybirths.dat") 
tsbirths <- ts(births, frequency=12, start=c(1946,1)) 
tsbirths 


الناتج 


Jul 
24.477 
23.479 
23.950 
24.104 
24.671 
26.451 
26.276 
27.009 
26.706 
28.361 
28.982 
28.065 
29.229 


[28:863 


Jun 
24.364 
20.761 
22.123 
22.874 
23.583 
24.667 
24.737 
24.635 
26.122 
26.219 
27.139 
27.390 
28.009 


125,985 


May 
25.806 
21.752 
22.222 
21.761 
25.320 
24.430 
23.988 
25.431 
27.210 
24.767 
28.527 
28.878 
27.931 
26.398 


رسم السلاسل الزمنية (Plotting Time Series)‏ 
يمكن ow)‏ السلسلة الزمنية timeSeries‏ باستخدام التعليمة: 


Apr 
24.740 
21.669 
21.672 
20.615 
23.673 
24.037 
22.646 
24.062 
26.199 
23.475 
26.975 
26.896 
26.589 
25.951 


Mar 
26.931 
23.709 
23.590 
22.424 
24.677 
25.076 
24.775 
25.565 
26.982 
26.721 
27.914 
27.543 
28.963 
27.660 


Feb 
23.598 
21.089 
20.035 
20.000 
20.894 
23.049 
22.270 
22.644 
23.304 
24.239 
24.218 
24.848 
24.924 
25.286 


Jan 
26.663 
21.439 
21.937 
21.548 
22.604 
23.287 
23.798 
24.364 
24.657 
24.990 
26.217 
26.589 
27.132 
26.076 
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1946 
1947 
1948 
1949 
1950 
1951 
1952 
1953 
1954 
1955 
1956 
1957 
1958 


E 








plot.ts(timeSeries) 


فلو أردنا owy‏ كل من السلسلتين اللتين أنشأنهما سابقاً tskings,tsbirths‏ نكتب: 


لال الیم 





(tskings) 


plot.ts 








Time 


10 





tskings 
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اا 


plot.ts(tsbirths) 
الناتج‎ 





tsbirths 








1 1 1 1 1 1 1 
1946 1948 1950 1952 1954 1956 1958 1960 


Time 








(Decomposing Time Series) تفكيك السلاسل الزمنية‎ 


andig‏ بتفكيك السلسلة الزمنية عزل المركبات المكونة لها وهي مركبة الاتجاه العام 
والمركبة الموسمية ومركبة الخطأ العشوائي. وسنفترض أن سلسلتنا مشكلة من هذه 
المركبات بواسطة الجمع, أي .TS = Trend + Seasonal + Random “yl‏ وإذا كانت 
السلسلة مشكلة من هذه المركبات بواسطة الجداء يمكن ردها إلى حالة الجمع بأخذ 
اللوغاريتم لبيانات السلسلة الزمنية. 


لتفكيك سلسلة زمنية يجب Jol Ude‏ تنزيل الحزمة TTR‏ بالشكل: 
install.packages(“TTR”)‏ 
library(“TTR”)‏ 


بفرض أن سلسلتنا لا تمتلك مركبة موسمية عندها يمكن التخلص من المركبة العشوائية 
والحصول على مركبة الاتجاه العام باستخدام المتوسطات المتحركة البسيطة من المرتبة 
بواسطة التعليمة: 


SMA(timeSeries,n=span) 











R البرمجة الإحصائية‎ ao) 


بالعودة لسلسلة أعمار وفاة ملوك بريطانيا والتي يبدو من رسمها البياني أنها لا تمتلك 
مركبة موسمية وبالتالي يمكن الحصول على مركبة الاتجاه العام بتنعيم السلسلة 
الزمنية باستخدام المتوسطات المتحركة من المرتبة الثامنة مثلا: 






التعلامة 


kingsMA<-SMA(tskings,n=3) 
plot.ts(kingsMA) 


الناتج 
e 4‏ 
ل ع 
ل ع 
a‏ = 
v‏ 
T T T T T‏ 
40 30 20 10 0 


Time 


kingsMA 














والرسم السابق يسمح لنا بالقول: إن أعمار وفاة الملوك انخفضت من 55 سنة إلى 38 سنة 
تقريباً خلال أول 20 سنة ثم بدأت بالزيادة فيما بعد إلى 73 سنة للملك رقم 40 تقريباً. 


أما إذا كانت سلسلتنا موسمية عندها نستخدم التعليمة: 


decompose(mySeries) 


فبالنسبة GUL‏ سلسلة الولادات في ‘New York‏ 





birthsComponents<-decompose(tsbirths) 
plot(birthsComponents) 
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Decomposition of additive time series 


28 


observed 
24 


20 


seasonal 


random 


trend 
05 05 152 24 26 


15 -05 05 180 -05 0. 








يمكننا الوصول لأي مركبة من مركبات السلسلة الزمنية بذكر اسم السلسلة ثم الرمز $ ثم 
اسم المركبة كما يلي 
TE‏ 


timeSeries$trend مركبة الاتجاه العام‎ 
timeSeries$seasonal ärowgoll 415,01 
timeSeries$random العشوائي‎ ball مركبة‎ 





التمهيد الأسي البسيط (Simple Exponential Smoothing)‏ 
إذا كانت لديك سلسلة زمنية لا تمتلك مركبة موسمية وليس لها اتجاه عام عندها بإمكانك 
إجراء تنبؤات باستخدام التمهيد الأسي البسيط. والذي يقوم بالتنبؤ بالقيم اللاحقة 
بالاعتماد على القيم السابقة بوزنها بوسيط alpha‏ يأخذ قيمه بين الصفر والواحد. فكلما 
كانت alpha Goud‏ أقرب إلى الواحد دلنا هذا على ارتباط أكبر للقيمة اللاحقة بالقيمة 

السابقة. ويمكن إجراء التمهيد الأسي البسيط باستخدام التعليمة: 


HoltWinters(timeSeries,beta=F,gamma=F) 
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سنطبق التمهيد الأسي البسيط على بيانات كميات هطول الأمطار السنوية في لندن خلال 
العام 1912-1813 من الموقع ‘https://robjhyndman.com/tsdidata/hurst/precipl.dat‏ 


daien 
rain <- scan("https://robjhyndman.com/tsdidata/hurst/precip1.dat",skip=1) 
raints <- ts(rain,start=c(1813)) 
rainforecasts <- HoltWinters(raints, beta=FALSE, gamma=FALSE) 
rainforecasts 
plot(rainforecasts) 

ail 


Holt-Winters exponential smoothing without trend and without seasonal component. 


Call: 
HoltWinters(x = raints, beta = FALSE, gamma = FALSE) 


Smoothing parameters: 
alpha: 0.02412151 
beta : FALSE 
gamma: FALSE 


Coefficients: 


11] 
a 24.67819 


Holt-Winters filtering 


Observed / Fitted 




















T T T T T 
1820 1840 1860 1880 1900 


Time 








E,‏ ب m‏ سنة لاحقة sloic JL‏ على سلسلة التنبؤات tsForecasts‏ المبنية بواسطة التابع 


HoltWinters‏ نستخدم التعليمة: 


predict(tsForecasts,n.ahead=m) 
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بالعودة لمثالنا السابق وللتنبؤ بسلسلة الأمطار لعشر سنوات لاحقة نكتب: 







adei 


predictedRain<-predict(rainforecasts,n.ahead = 10) 
plot(rainforecasts) 
lines(predictedRain,col="red") 






الناتج 
Time Series:‏ 
Start = 1913‏ 
End = 1922‏ 
Frequency = 1‏ 
fit‏ 
24.67819 ],1[ 
24.67819 ],2[ 
24.67819 ],3[ 
24.67819 ],4[ 
24.67819 ],5[ 
24.67819 ],6[ 
24.67819 ],7[ 
24.67819 ],8[ 
24.67819 ],9[ 
24.67819 ],10[ 


Holt-Winters filtering 


Observed / Fitted 




















T 1 1 1 
1820 1840 1860 1880 1900 


Time 








حتى نحكم على جودة نموذجنا يمكننا حساب مجموع مربعات الأخطاء SSE‏ بالشكل: 


rainforecastsSSSE 


| [1] 1828.855 
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Wg‏ نستطيع الاستفادة من هذه القيمة وحدها. إنما يمكن استخدامها للمقارنة بين عدة 
نماذج لاختيار النموذج الأفضل والذي يكون فيه SSE‏ أصغر ما يمكن. 


وهناك plo bpi‏ يجب التأكد aio‏ لنعلم فيما إذا كان نموذج التمهيد الأسي ملائماً 
لبياناتنا أو يحب البحث عن نموذج آخر. وهو استقلال الرواسب وعدم وجود ارتباط ذاتي 
بينها. ويمكن التأكد من ذلك بالشكل: 


التعليمة 
Box.test(residuals(rainforecasts),lag=20,type = "Ljung-Box")‏ 
acf(residuals(rainforecasts),lag.max = 20)‏ | 
الناتح 
Box-Ljung test‏ 


data: residuals(rainforecasts) 
X-squared = 17.401, df = 20, p-value = 0.6268 


Series residuals(rainforecasts) 





























oJ 
© ل‎ 
o 
e ل‎ 
o 

W 
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ا 
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0 5 10 15 20 
Lag 








يستخدم اختبار Ljung-Box‏ لاختبار صحة الفرضية الابتدائية القائلة )910 وجود ارتباط ذاتي 
بين الرواسب. فإذا كان 0.05<م lä‏ هذه الفرضية Lol‏ إذا كان 0.05>م رفضناها. وفي مثالنا 
995 وبالتالي لا يوجد ارتباط ذاتي بين الرواسب. 

كما يقدم U‏ الرسم البياني أيضاً وسيلة أخرى لاختبار الفرضية السابقة, حيث يجب أن لا 
تتجاوز قيم الارتباط الذاتي خطوط المعنوية المنقطة. وفي مثالنا تقترب قيمة الارتباط 
الذاتي عند الفجوة 3 فقط من خط المعنوية دون أن .ojglai‏ وبالتالي إن الرسم السابق 
يدعم النتائج التي توصلنا leu!‏ باستخدام اختبار .Ljung-Box‏ 
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يجب أيضاً التأكد من أن للرواسب Lojo‏ طبيعياً بمتوسط صفري وتباين cul‏ ويمكن التأكد 
من ثبات التباين بالشكل: 


allen) 


plot.ts(residuals(rainforecasts)) 


الناتج 





residuals(rainforecasts) 




















T T 
1820 1840 1860 1880 1900 


Time 





ونلاحظ أن تباين الرواسب cul‏ عبر الزمن لأن الرواسب تنتشر بشكل عشوائي حول خط 
وهمي ليس له اتجاه عام في الزيادة أو النقصان. 


للتأكد من أن للرواسب توزيعاً طبيعياً بمتوسط صفري نستطيع تطبيق أي اختبار من 
اختبارات الطبيعية التي ذكرناها في الفصل السابع, وكذلك نستطيع التأكد من أن للرواسب 
متوسطاً صفرياً باستخدام اختبار t‏ للعينة الواحدة. وسنترك هذين الموضوعين للقارئ. 
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التمهيد الأسي لهولت (Holt’s Exponential Smoothing)‏ 
يمكن استخدام نموذج هولت للتمهيد الأسي إذا كان للسلسلة الزمنية اتجاهاً lole‏ بالزيادة 
أو النقصان دون مركبة موسمية. سيكون لدينا في نموذج هولت معلمتين beta g alpha‏ 
cus‏ تمثل alpha‏ معلمة المستوى وتمثل beta‏ معلمة الاتجاه olol‏ ولكل من المعلمتين 

السابقتين قيم بين 190 


سنستخدم البيانات الآتية: https://robjhyndman.com/tsdidata/roberts/skirts.dat‏ والتي 
Jiaj‏ قياسات الخصر لتنانير النساء من عام 1866 حتى عام :191١‏ 








اقلق 
skirts <- scan("http://robjhyndman.com/tsdldata/roberts/skirts.dat",skip=5)‏ 
skirtsseries <- ts(skirts,start=c(1866))‏ 
plot.ts(skirtsseries)‏ 
al‏ 
‘als ia ae 1 9 0‏ 7 
Time‏ 





نلاحظ أن بيانات السلسلة الزمنية لها oly il‏ عام بالزيادة من عام 1866 حتى 1880 ثم لها 
اتجاه عام بالتناقص حتى ]191 


سنستخدم التابع HoltWinters()‏ لنمذجة السلسلة الزمنية السابقة بالشكل: 
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skirtsforecasts<-HoltWinters(skirtsseries,gamma=FALSE) 
skirtsforecasts 
| plot(skirtsforecasts) 


Holt-Winters exponential smoothing with trend and without seasonal component. 





Call: 
HoltWinters(x = skirtsseries, gamma = FALSE) 


Smoothing parameters: 
alpha: 0.8383481 
beta: 1 
gamma: FALSE 


Coefficients: 
[L1] 

a 529.308585 

b 5.690464 








Holt-Winters filtering 
Q 
Ss لك‎ 
2 
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ويمكن التنبؤ بالقيم Anat I‏ 1 لسلة Me and ji‏ الطريقة |١‏ تبعة في )239.0 
التمهيد الأسي البسيط. 

كذلك يجب التأكد من عدم وجود ارتباط ذاتي للرواسب. ومن أن الرواسب تتوزع وفق 
التوزيع الطبيعي بمتوسط صفري, وكل هذا سنتركه للقارئ لأنه يتم boloj‏ كما قد سبق 
في التمهيد الأسي البسيط. 
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التمهيد الأسي لهولت ووينترز (Holt-Winters Exponential Smoothing)‏ 
نستخدم التمهيد الأسي og)‏ ووينترز إذا كان للسلسلة الزمنية اتجاهاً عاما ومركبة 
موسمية. وبالتالي سيكون لنموذجنا ثلاث معلمات. alpha‏ معلمة المستوي. و beta‏ 
معلمة الاتجاه oll‏ و gamma‏ معلمة الموسمية. 


سنستخدم بيانات السلسلة الزمنية: htto://robjhyundman.com/tsdidata/data/fancy.dat‏ 
والتي تمثل المبيعات الشهرية في أحد شواطئ أستراليا من 1987 حتى نهاية 1993 






التعلامة 











souvenir <- scan("http://robjhyndman.com/tsdidata/data/fancy.dat") 
souvenirts <- ts(souvenir, frequency=12, start=c(1987,1)) 
plot.ts(souvenirts) 
الناتح‎ 
1 nae 1 aa 1 a5 1 pa 1 ši 1 pa 1 aie 1 5 
Time 








نلاحظ أن قيمة السلسلة الزمنية كبيرة جدأ. مما Way‏ أن السلسلة الزمنية digSo‏ من 
مركباتها بواسطة elagi‏ وبالتالي يجب ردها إلى سلسلة جمع بأخذ اللوغاريتم كما يلي: 





logts<-log(souvenirts) 
plot.ts(logts) 
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logts 








ل 2 

ea =| 

ل م 
T‏ 


1 1 1 1 T 1 1 
1987 1988 1989 1990 1991 1992 1993 1994 


Time 








والآن سنشكل نموذج هولت ووينترز بالشكل: 


ee‏ سس 
logtsforecasts<-HoltWinters(logts)‏ 
logtsforecasts‏ 


jl 
Holt-Winters exponential smoothing with trend and additive seasonal component. 
Call: 
HoltWinters(x = logts) 
Smoothing parameters: 
alpha: 0.413418 
beta : 0 
gamma: 0.9561275 
Coefficients: 
[1] 
a 10.37661961 
b 0.02996319 
s1 -0.80952063 
s2 -0.60576477 
s3 0.01103238 
s4 -0.24160551 
s5 -0.35933517 
s6 -0.18076683 
s7 0.07788605 
s8 0.10147055 
s9 0.09649353 
s10 0.05197826 
s11 0.41793637 
s12 1.18088423 
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يمكننا أيضاً رسم السلسلة المتنبأة والقيام بالتنبؤ بنفس الأسلوب السابق, حيث lind‏ 
بالتنبؤ بقيم السلسلة الزمنية ل 48 last how‏ أي 3 سنوات. وبالتالي سنكتب: 








التعليمة 
plot(logtsforecasts,xlim=c(1988,1998),ylim=c(7,13))‏ 
lines(forecasting,col="red")‏ 
الناتح 
Holt-Winters filtering‏ 
oa 4‏ 3 
‘ins iene one ae ma Ea‏ 
Time‏ 








يجب أيضأ التحقق من عدم وجود ارتباط ذاتي بين الرواسب. ويجب التحقق من توزيع 
الرواسب طبيعياً بمتوسط nàn‏ وسنترك هذه الأمور للقارئ. 
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نماذج الانحدار الذاتي والمتوسطات المتحركة التكاملية لبوكس وجينكينز 


(Box — Jenkins Autoregressive Integrated Moving Averages Models) 


نماذج التمهيد الأسي تشترط عدم وجود ارتباط ذاتي بين الرواسب كما تشترط أن للرواسب 
توزيعاً طبيعياً بمتوسط صفري وتباين cui‏ لكنها لا تشترط أي شيء حول وجود ارتباط 
ذاتي بين قيم السلسلة الزمنية بحد ذاتها. glg‏ أخذ هذا الارتباط بعين الاعتبار يحسن كثيراً 
من دقة التنبؤ في كثير من السلاسل الزمنية. 

تشترط سلاسل ARIMA‏ أن تكون السلسلة الزمنية مستقرة. وإذا كانت السلسلة ليست 
مستقرة فيمكن تحويلها إلى سلسلة مستقرة بأخر تحويلة الفروق للسلسلة الزمنية, 


وهذا ما سنبداً به: 


تحويلة الفرق للسلسلة الزمنية :(Differencing of Time Series)‏ 
نرمز لنموذج ARIMA‏ بشكل ole‏ بالرمز (و.90,م)88108, المركبة d‏ تعني مرتبة الفروق التي 
تم إجراؤها على السلسلة الزمنية حتى أصبحت مستقرة. فلو أجرينا فرقاً واحداً لكتبنا 

.01660 ul وهكذا.... ويمكن أخذ الفرق للسلسلة الزمنية باستخدام‎ ARIMA(p,1.q) 
لوجدنا أنها ليست‎ Luly لو نظرنا إلى سلسلة قياس الخصر للتنانير التي استعرضناها‎ 
مستقرة:‎ 


1000 
1 
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skirtsseries 
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بأخذ الفرق من المرتبة الأولى نجد: 


tot 
skirts_d1<-diff(skirtsseries, differences = 1) 
plot.ts(skirts_d1) 








Time 











ونلاحظ أن السلسلة لا زالت غير مستقرة لذلك سنأخذ الفرق من المرتبة الثانية: 


ااا Adol‏ سس 
skirts_d2<-diff(skirtsseries,differences = 2)‏ 
plot.ts(skirts_d2)‏ 


الناتج 





40 


skirts_d2 


Lath | 
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Time 








SLAI 7 أص‎ al ١١ ونلاحظ أن‎ 
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الخطوة الآتية هي معرفة قيم كل من p.q‏ ومعناهما في ‘ARIMA(p.d,q)‏ 


اختيار نموذج ARIMA‏ الملائم (Selecting Appropriate ARIMA Model)‏ 
اختيار نموذج ARIMA‏ الملائم يعني اختيار قيم كل من p,a‏ المناسبتين, وذلك يتم Sloic JL‏ 
على كل من دالة الارتباط الذاتي ودالة الارتباط الذاتي الجزئي باستخدام التابعين g acfQ)‏ 

pacf() 

-نستخدم النموذج AR(p)=ARIMA(p,0,0)‏ عندما تكون قيم دالة الارتباط الذاتي الجزئي 
تساوي jan)!‏ بعد الفجوة رقم p‏ وتقترب قيم دالة الارتباط الذاتي من الصفر Laja‏ 
-نستخدم النموذج MA(q)=ARIMA(O,0.q)‏ عندما تكون قيم دالة الارتباط الذاتي تساوي 
الصفر بعد الفجوة رقم .q‏ وتقترب قيم دالة الارتباط الذاتي الجزئي من الصفر Laja‏ 
-نستخدم النموذخج (و,0,م)8681118-(8,م)88)18 إذا كانت قيم كل من دال الارتباط الذاتي ودالة 
الارتباط الذاتي الجزئي تقتربان من الصفر Loya‏ 

لنأخذ السلسلة الزمنية الآتية التي تمثل الغبارات البركانية في نصف الكرة الأرضية 
الشمالي من العام 1500 وحتى 1969: http://robjhyndman.com/tsdidata/annual/dvi.dat‏ 




















اا 
volcanodust<-scan("http://robjhyndman.com/tsdidata/annual/dvi.dat", skip=1)‏ 
vdts<-ts(volcanodust,start=c(1500))‏ 
plot.ts(vdts)‏ | 
al‏ 
1 كت 
sak nm 55‏ 9 5 1 
Time‏ 
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نلاحظ أن السلسلة الزمنية السابقة مستقرة في المتوسط والتباين حيث يبين أن مستواها 
وتذبذبها بشكل عام ثابت على طول الزمن. 


سنقوم الآن برسم تابع الارتباط الذاتي للسلسلة السابقة وإيجاد قيم الارتباطات الذاتية: 


E 
acf(vdts,lag.max = 20) 
acf(vdts,lag.max = 20,plot=FALSE) 

الناتج 


Series vdts 


06 08 1.0 
| 1 


ACF 
04 





0.0 








Autocorrelations of series ‘vdts’, by lag 


0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 
1.000 0.666 0.374 0.162 0.046 0.017 -0.007 0.016 0.021 0.006 0.010 0.004 0.024 0.075 0.082 
15 16 17 18 19 20 
0.064 0.039 0.005 0.028 0.108 0.182 





نلاحظ من الشكل السابق أن قيم الارتباط الذاتي للفجوات الأولى والثانية والثالثة تجاوزت 
خط المعنوية المسموح به ثم بدأت تنعدم من الفجوة الرابعة وما بعدها. 


سنقوم الآن برسم تابع الارتباط الذاتي الجزئي للسلسلة الزمنية السابقة وإيجاد قيم 
الارتباطات الذاتية الجزئية لها: 
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التعليمة 
pacf(vdts,lag.max =20)‏ 
pacf(vdts,lag.max =20,plot=FALSE)‏ 

الناتج 


Series vdts 


04 06 


Partial ACF 





0.0 








Partial autocorrelations of series ‘vdts’, by lag 


1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 
0.666 -0.126 -0.064 -0.005 0.040 -0.039 0.058 -0.016 -0.025 0.028 -0.008 0.036 0.082 -0.025 -0.014 
16 17 18 19 20 
, 0.008 -0.025 0.073 0.131 0.063 


نلاحظ من الشكل السابق أن فيم الارتباط الذاتي الجزئي للفجوات الأولى والثانية تجاوزت 
خط المعنوية المسموح به ثم بدأت تنعدم من الفجوة الثالثة وما بعدها. 








نحن الآن في حيرة أمام ثلاثة نماذج ممكنة: 
:ARIMAC2,0,0)‏ لأن دالة الارتباط الذاتي الجزئي انعدمت اعتباراً من الفجوة الثالثة. 
Yİ :ARIMACO,0,3)‏ دالة الارتباط الذاتي انعدمت اعتباراً من الفجوة الرابعة. 


(0,9.م)688108: كون كل من دالتي الارتباط الذاتي والارتباط الذاتي الجزئي تنعدمان تدريجياً. 


الحل هو استخدام الدالة avto.arima‏ حيث تعطي هذه الدالة أفضل نموذج ARIMA‏ 
لملاءمة بيانات السلسلة الزمنية: 
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myModel<-auto.arima(vdts) 
myModel 
الناتح‎ 
| Series: vdts 
ARIMA(1,0,2) with non-zero mean 


Coefficients: 
ar1 mal ma2 mean 
0.4723 0.2694 0.1279 57.5178 
s.e. 0.0936 0.0969 0.0752 8.4883 


sigma^2 estimated as 4897: log likelihood=-2661.84 
| AIC=5333.68 AlCc=5333.81 BIC=5354.45 


تبين التعليمة السابقة أن أفضل نموذح هو ARIMAC.0.2)‏ وتعطينا معالمه والأخطاء 
المعيارية في المعالم. كما توفر W‏ أيضاً معايير كل من AIC‏ و 8/66 و BIC‏ لمقارنة عدة 
نماذج واختيار النموذج الأفضل. 








forecast(myModel,h = 10) 
الناتج‎ 

| Point Forecast Lo 80 Hi 80 Lo 95 Hi 95 
1970 22.67720 -67.00065 112.3550 -114.4732 159.8276 
1971 38.42748 -73.22746 150.0824 -132.3340 209.1890 
1972 48.50091 -71.10909 168.1109 -134.4268 231.4286 
1973 53.25886 -68.05471 174.5724 -132.2742 238.7920 
1974 55.50617 -66.18421 177.1965 -130.6032 241.6155 
1975 56.56763 -65.20665 178.3419 -129.6701 242.8053 
1976 57.06898 -64.72400 178.8620 -129.1973 243.3353 
1977 57.30579 -64.49137 179.1029 -128.9669 243.5785 
1978 57.41764 -64.38045 179.2157 -128.8565 243.6917 

| 1979 57.47046 -64.32783 179.2688 -128.8040 243.7449 











نلاحظ أن R‏ قدم لنا تنبؤات لعشر سنوات مع مجالات تنبؤ بمستوى %80 و %95 


ماذا لو أردنا Ow)‏ النموذج مع القيم المتنبأة المستقبلية؟ 


ذلك يتم بالشكل الآتي: 
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التعليمة 
plot(forecast(myModel))‏ 


الناتج 







Forecasts from ARIMA(1,0,2) with non-zero mean 
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أخيراً نقول إن السلاسل الزمنية pila ale‏ بحد ذاته. وكذلك كل فصل في هذا الكتاب هو 
ale‏ قائم بحد ذاته. ولن نستطيع أن نعطي هذه العلوم حقها في كتاب متواضع كهذا, 
لكن الهدف هو وضعك عزيزي القارئ في بداية الطريق لتكمل أنت إبحارك كما تحتاج 
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